文章の男女鑑定プログラム
2004年 08月 15日

Koppel氏らは 多くの著作物でみられる、性別による特徴とフィクションとノンフィクションの特徴を見つけるため、 566の英語作品について数件のテストケースを使って「訓練」しました。(テストに使われた作品の多くは1975年より後に出版されたもの)
その結果、どんなジャンルでも、そのキーワードと構文を調べるだけで、約80%の精度で性別を判定でき、またフィクションか、ノンフィクションかの鑑定を98%の正確さで判定することができました。
このプログラムがうまく機能したのも、男性はものごとについて話すことが多く、女性は関係について話すことが多い特徴があり、また、ノンフィクションは情報を提供することが多く、フィクションは人間関係に重点がおかれると、いうことを考えれば意外ではないとKoppel氏は言う。
また、女性は代名詞(I、you、she、their、myself)を、男性は、名詞を同定あるいは決定する言葉(a、the、that)や、その量を定める言葉(one、two、more)を好んで使う特徴もあるそうです。
今後、このイスラエルの研究チームは、こうした男女やフィクション・ノンフィクションの違いが過去にさかのぼっても同じかどうかを調査し、さらに、他かの言語でも、男女やフィ クション・ノンフィクションの違いがみられるかについて、調査する予定だそうです。
(*^・ェ・)ノ ジョージ・エリオットは女流作家なんてことも簡単に判明できてしまうのです。

クリックをよろしくお願いします!備考: 文章 鑑定 男女 プログラム ノンフィクション 言語 イスラエル調査