ネットをだらーっと見てたらこんなのを見つけた。
https://honkoku.org/ みんなで翻刻
人文学オープンデータ共同利用センターってとこのプロジェクトページ。
つまるところ江戸時代前とかの文字ってみんな読めないからAIで自動認識させて役立てようってサイトみたい。
確かにこういう文字で書かれた情報の中でも役に立つ情報って多そうだよね。昔の出来事をまとめたものがあれば地震とか津波の記録なんかもあるだろうし、歴史のひもときにも役に立ちそう。歴史学者にしろ土木学者にしろこういう字の情報に直接アクセスできなくて解明されなかったものがあるだろうし、ぜひとも完成までこぎ着けてほしいよねぇ。
——って話は置いといて。これも日本語なのにたいていの人は読めないってのがなんかいいですよね。
江戸末期の文献ならたかだか150年前のはずなのに、字が崩されてるせいで読めないんですよね。しかもそれより1000年ぐらい昔はみんなこんな感じに崩した字なわけで、日本語の歴史の中でほとんどの期間に書かれた文献を読めないんですよね。
しかも崩し方は前後の言葉、時代、書いた人のセンスで処理されるから、字の形だけでOCRしようとしても正しく読めないという。まあでも筆の運びの綺麗さで字を書いてるみたいな感じがとても日本的でいいよなーとは思うけど、これってほんとに言語なの?
多分明治維新で日本が変わり、すべての人に学校という機関で教育するにあたり画一的な教育要領が必要になって楷書を教えるようになったみたいな感じかなーと。で、明治頃にあった古い文化をなんでも捨てて新しくしていく感じとかそれもまた日本的でいいなぁと思うけどね。
あいにく古文に長けてないので協力はできないけど、上記のとおり生かされるべき知恵はたくさん眠ってるだろうから応援したい限りですねー。
まふまる体が…!
字の話の延長として。
手書きフォント「まふまる体」が5年ぶりぐらいにアップデートします! 自分の中でまた再燃してます!
今回はあの後に登場した東方キャラ、艦これ艦娘、AQOURSの人々の名前を追加したほか、小6漢字の補強、全角英語を追加します。
明日かなんかに更新できるかなーと。