受験生のみなさん、「牛車」は「ぎっしゃ」。いちおうね。
*
ただいま、UbuntuにMeCabを入れて何かおもしろいことをしようとしています。
[Python][Mecab]ubuntu環境にmecabをインストールする方法 · GitHub
$ sudo apt-get install mecab libmecab-dev mecab-ipadic
$ sudo aptitude install mecab-ipadic-utf8
$ sudo apt-get install python-mecab
行いました(2017/1/5)。
明日行うこと
- 中古和文UniDicのダウンロードとインストール
1日1処理ずつ進めていきます。
何の話?
目標は、高校生用の古文品詞分解プリントの機械的な作成+αです。ブラウザやアプリから、目的の古文テキスト(例えば、枕草子の第1段)をアップロード/テキストボックスにコピペすると、品詞分解を行ったプリントが作成され、PDFでダウンロード/メール送信ができるというもの(+α)。
私の数少ない自慢の1つが中世古文の品詞分解です。受験から25年が過ぎましたが、いまだにほぼ完璧を維持しています。えへん。現代語もできるよw
+αというのは、
- 有名な作品、有名な段は、出来合いの(僕の作った)品詞分解プリントを用意しておく
- 機械学習させる。精度が(どこまで)高まるかどうかは、やってみないとわかりません
ところで
ところで、id:kikumonagonさん、何かいいサービス名はないでしょうか。「なごんたん」でしょうか。「まぶちゃん」(賀茂真淵)とか「のりなガー」(本居宣長)とか「晋くん」(大野晋先生)とか考えたんだよ。「丸谷くん」はすでにあるしね。
受験勉強の気休めに、何かいいアイディアが浮かんだらぜひ知らせてください。