好きな文を入力してください(愛,家庭,義務のようにコンマで区切った語句だけでもOKです)
ここに結果が入ります
*こんなことを聞いたら夏目漱石はどう答えてくれるだろう?という素朴な疑問から作ってみました。
*自分の聞きたいことの語句を含む文章を作品中から選びだせば、答えも含んでるのではないかと考えました。
*全作品を分かち書きしてTensorflow のWord2vecをして語句のembeddings を出しました。
*作品中の文章のなかで入力した語句と文中の語句の親和性の和を計算して一番大きい文を選ぶようにしました。
→同じ語句が文中にある場合は1(最大の値)、文中にない場合は近い語句のほうが大きくなるので和が最大になる文を選びます。
*全作品、全語句でやるとファイルのサイズが大きすぎるので語句は頻度の多い順、文章は語句を多く含む順に抽出しました。