読者です 読者をやめる 読者になる 読者になる

illegal function call in 1980s

1980年代のスポーツノンフィクションについてやさぐれる文章を書きはじめました。最近の関心は猫のはなちゃんとくるみちゃんです。

古文品詞分解サービスへの道 第1回

f:id:cj3029412:20170105201503p:plain

牛車のイラスト | かわいいフリー素材集 いらすとや

受験生のみなさん、「牛車」は「ぎっしゃ」。いちおうね。

*

ただいま、UbuntuMeCabを入れて何かおもしろいことをしようとしています。

[Python][Mecab]ubuntu環境にmecabをインストールする方法 · GitHub

$ sudo apt-get install mecab libmecab-dev mecab-ipadic
$ sudo aptitude install mecab-ipadic-utf8
$ sudo apt-get install python-mecab

行いました(2017/1/5)。

明日行うこと

1日1処理ずつ進めていきます。

何の話?

目標は、高校生用の古文品詞分解プリントの機械的な作成+αです。ブラウザやアプリから、目的の古文テキスト(例えば、枕草子の第1段)をアップロード/テキストボックスにコピペすると、品詞分解を行ったプリントが作成され、PDFでダウンロード/メール送信ができるというもの(+α)。

私の数少ない自慢の1つが中世古文の品詞分解です。受験から25年が過ぎましたが、いまだにほぼ完璧を維持しています。えへん。現代語もできるよw

+αというのは、

  • 有名な作品、有名な段は、出来合いの(僕の作った)品詞分解プリントを用意しておく
  • 機械学習させる。精度が(どこまで)高まるかどうかは、やってみないとわかりません

ところで

ところで、id:kikumonagonさん、何かいいサービス名はないでしょうか。「なごんたん」でしょうか。「まぶちゃん」(賀茂真淵)とか「のりなガー」(本居宣長)とか「晋くん」(大野晋先生)とか考えたんだよ。「丸谷くん」はすでにあるしね。

members.jcom.home.ne.jp

受験勉強の気休めに、何かいいアイディアが浮かんだらぜひ知らせてください。