これはかなり前から試験導入されてたようなので、ご存知の方が多いかもしれませんが。米アマゾンに新しい機能"Text Stats"が追加されたとのこと:
■ amazon book text stats (information aesthetics)
簡単に表現すれば、個々の本がどれだけ読みやすいかを示してくれる機能。百聞は一見にしかず、ということで、実際に"Out of Our Minds: Learning to be Creative"という本で確認してみましょう。
まず"Inside This Book"のセクションに移動します。この機能が使用可能な本であれば、上図のように、New! の部分に"Text Stats"のリンクがあるはずです。ちなみに"Concordance"という機能はテキストに登場する単語でタグクラウドを作ってくれる機能で、どんな単語が頻出しているかを一目で確認できます。これはこれで面白いですよ。
で、上記がこの本の Text Stats。個々の項目を解説するとこんな感じ:
- Readability: 読みやすさ
- Fog Index: この本を読むのに、何年の公的教育が必要かを示す数値。
- Flesch Index: 読みやすさを1~100で数値化したもの。数が大きければ大きいほど読みやすい。ちなみに小学校5、6年生であれば90~100ぐらいが適当、大学生であれば0~30ぐらいが適当、とのこと。
- Flesch-Kincaid Index: Flesch Index をアメリカの教育制度に当てはめたもの。年数を示し、「11.5」なら11.5年生=高校3年生程度のレベルということ。
- Complexity: 複雑さ
- Complex Words: 3音節以上から成る単語が含まれている割合。
- Syllables per Word: 1単語あたりの平均音節数。要は長けりゃ長いほど難しい言葉が使われてる、ってことですね。
- Words per Sentence: 1文あたりの平均単語数。
- Number of: 諸統計
- Characters: 文字数
- Words: 単語数
- Sentences: 文数
- Fun stats: 冗談モノ
- Words per Dollar: 1単語あたりの金額(単位:ドル)
- Words per Ounce: 1単語あたりの重さ(単位:オンス)
という内容。で、Readability から Number of までについては、あるカテゴリー(変更可能)の中でこの本がどのレベルに位置しているか、グラフで示してくれています。例えばこの本を例にすると、"Complex Words"の指標がこの本より高いもの(=難しい単語をより多く含んでいる本)は全体の31%、"Words per Sentence"の指標がより高いもの(=より長い文が使われている本)は全体の42%ということで、単語は比較的難しいけれど文の長さは平均的、ということが分かります。
この機能、自分にピッタリの指標や、基準となる本が見つかるとより使えるかもしれませんね。例えば自分は"Flesch-Kincaid Index"で確認した方がより探しているレベルが見つかりやすいとか、ある指標が"ABC"という本より大きい/小さいからこの本は難しい/易しいはず、とか。また検索条件にもこれらの指標が含められるようになれば、「とりあえず大まかな知識が必要だから、○○というテーマでサラッと読めるレベルの本が欲しい」というニーズにも応えられるようになるかもしれません。
うーん、米アマゾンには日本語版には導入されていない機能がいろいろありますが、これは和書でも使ってみたいなぁ。って、日本語じゃ単純に単語の長さ/文の長さで本の難しさを示すわけにはいきませんが(そもそも OCR でテキスト全体を正確にデジタル化するのにも問題があるし)。「この本はこれくらい簡単だよ/難しいよ」というのが客観的に分かるというのは、結構便利なんじゃないかと思います。
しかし Amazon.com の商品個別ページは、もうわけ分かんないくらい機能てんこ盛りになってますね……それはそれでどうなんだろう。
コメント