入門自然言語処理を学ぶ会がありがたい

オライリーの『入門 自然言語処理』を学習している。

入門自然言語処理を学ぶ会という月イチの勉強会に参加している。
各自で1章分を読んできて、学んだことを発表するという形式。
Pythonビギナーだし、自然言語処理も初めてなので、このぐらいのペースだと無理なくやれて良い。
凄腕Pythoneerの森本さんや金子さんから毎度新しいことを教えていただけて大変ありがたい。

発表用のソースコードをGithubにあげた。

pythonでtwitterのbotを作った

何かの文字列がツイートされたのに対して、何かをリプライするbotを作った。
pythonで自然言語処理を勉強し始めたところなので、こちらもpythonで作った。
python-twitterという素晴らしいラッパーにあやかった。

tw_python_bot

どこかのサーバーで動かす必要があったので、さくらのVPSを契約して動かしてみたが、むしろVPSのサーバー構築の方が大変であった。

この辺の記事に教えを請うた。
http://d.hatena.ne.jp/killinsun/20130606/1370542828
http://qiita.com/mima_ita/items/ecdf7de2fe619378beee

hanamogeraの分析

暑い。
むしろ暑くて半ズボンを履いてきたために、電車の冷房が効きすぎで寒い。

ここしばらく、自分の関心がどこにあるのかいろいろ調べていた。
どうやら私は「言葉」に対して恨みがあるようなので、言葉をめちゃくちゃにする何かに取り組んでいこうと思っている。
現状の分析を書き出してみる。

—–
【問題意識】
・言葉があるから人間は騙される
・文字や言葉をめちゃくちゃにして、意味を解体したい

【キーワード】
・文字
・言葉
・言語

【直感、引用】
・言葉は意味を伝えるものではない。コミュニケーションの手段じゃなくしたい
・言語の本質は沈黙である
・タモリのハナモゲラにテクノロジーを取り入れたとき、何が可能になるのか

【言葉の構造】
・言葉を分析する3つの観点:形、音、意味
・表意文字、表音文字
・音と記号

【参考事例】
〈言葉の「形」を解体する〉
モリサワ フォントパーク
□□□「あたらしいたましい」MV
・アスキーアート
吉田戦車の新しい字
〈言葉の「音」を解体する〉
タモリ 四ヶ国語麻雀
大橋巨泉の「はっぱふみふみ」CM
ハナモゲラ相撲中継
ドイツ語で排泄ネタ
〈言葉の「意味」を解体する〉
ダミーテキストジェネレーター
Allison Parrish – New Interfaces of Textual Expression

〈「音」を「形」に変換する〉
・ドラえもんひみつ道具のコエカタマリン
〈「音」を「意味」に変換する〉
・空耳アワー
〈「意味」を「形」に変換する〉
・うんこくさいを雲黒斎という名前にする(クレヨンしんちゃん)

〈コンピュータがピザを注文する〉
フォルマント兄弟

〈単語で和歌をつくる〉
連続駅で五七五七七

【疑問】
・テクノロジーの進歩によって、言語はどのように変質するのか WIRED 21世紀の教科書
・暗号と言語はどのような関係があるのか
・言葉が情報でなくなる、ということはあり得るか
・沈黙を言葉にするというのは、どうすれば可能か。モールス信号的なもの?
・詩ってなんだろう。poeticと、ここでテーマにしている言葉とはどういう関係があるか
・コンピュータを使わずに、計算で言語をめちゃくちゃにする方法はないか。例:怪文書?

【メモ】
・言葉をはちゃめちゃにすることで、人を笑わせられないか
・書き順を壊したい
・なぜ漢字に書き順があるのか。こどもは積み木のメタファーから、下から順に線を積み上げていく。ひらがなはもともとつながっていたものだから書き順が重要なのは分かるけども
—–

いろいろ書いてみたが、おおもとはタモリの四ヶ国語麻雀やハナモゲラ語におもしろさを見出すところから始まっている。
その他は、そこからの派生にすぎない。

自然言語処理の入門書を読みながら、NLTKを学習している。

JINS MEME アイディアコンテストの企画

2015/4/17 追記あり

眼電位センサーで自分の眠気や疲れを測定できるメガネがある。
JINS MEMEというもので、それを活用したアプリのアイディアを募るコンテストが開催されている。
https://developers.jins.com/ja/ideapitch/

いっちょ応募してみようと思い、アイディアフラッシュなるものをやってみたので、恥を忍んで公開する。

IMG_4295

IMG_4296

IMG_4297

IMG_4298

IMG_4299

IMG_4300

IMG_4301

IMG_4302

IMG_4303

IMG_4304

 

【追記】アイトラッキング技術の先行事例として見つけたものはこちら。

Eyecode
Golan Levin
自分のまばたきがシステムに記録され、再帰的に痕跡が残っていく作品。

The Eye Writer
Zachary Lieberman
アイトラッキングで描いたグラフィティをプロジェクションする

Eye Play the Piano
FOVE / 筑波大学附属桐が丘特別支援学校
手や腕を使わずに「目線」で演奏することができるユニバーサルピアノ。インターフェイス上の音符パネルに視線をあわせ、瞬きをすることで、そのパネルに割り当てられた音がピアノから奏でられる。

重複肢体不自由者自立支援システム
Tobii / 山梨大学
肢体不自由で、発話が不可能な重複肢体不自由者が、視線入力によってコミュニケーションを実現するシステム。

自閉症における視線計測の臨床応用
Tobii / 大阪大学
「いつ、どこを見ているか」についての視線計測データを解析することによって、自閉症郡を従来の方法(眼を見る時間を計測する)よりも鋭敏に判別できる。

運転者が無自覚に運転している状態を明らかにする
Tobii / アウディ
無自覚の運転(Driving without awareness -DWA)とは、周りを取り巻く道路状況に対して少ししか、あるいは全く自覚していない運転感覚のことをいう。例えば高速道路の長時間運転などの状況。DWAが起こりやすい状況や外的ファクターを特定することで、路上の安全に関する効果を解析する。

霊長類の認知の研究
Tobii / 京都大学
アイトラッキング技術は動物の心を理解するための手法として活用できる。

卓球プレイヤーのアイトラッキング
Tobii
視線がピンポン球を追いかけている。

ウェブサイトのユーザビリティ調査
ミツエーリンクス
ユーザがウェブサイトを閲覧する際に、視線がどこに向けられているかを分析することで、ユーザビリティの問題点を発見し、改善につなげることが可能になる。

ものづくりの指針

自分が何かをつくるうえでのテーマを整理してみる。

  • シンプルなワンアイディアを実現する
  • プロセスをデザインする
  • 音とシンクロする
  • コンピューテーション
  • スクリーン上のみに限定されない
  • 自分で方法論をつくる。新しい方法論でなければ新しい表現にならない
  • 実験的である
  • ものごとの構造を発見する

まぶしいスケッチを書いた

五十嵐と田邊くんの会合の名称は四ツ谷の会(仮)に決まった。
今日の3回目の四ツ谷の会用に、スケッチを作った。

昨年見に行った光るグラフィック展で見たっぽいやつ。
canvasでアニメーションを書いた。

graphic_illuminating

あと、今日の会にはゲストで松竹と田邊くん友人のけんちゃんが参加してくれた。
地味に熱くダメ出ししてくれたし良き時間を過ごせた。

来週は何持って行こうかな。
ていうか画面見すぎて酔った。

単位展はコンピューテーションを実践していた

単位展に行ってきた。
最近の俺の問題意識である「計算する」ことの示唆を得られる良い展示だった。

コンピュータでものを作るおもしろさは何かと考えたときに、「コンピューテーション」という言葉がひとつのキーワードになると考えている。
徳井さんのtumblrにて、浦川さんのsfpc報告会がまとめられているが、computingとcomputationの違いが分かりやすく書かれている。

ComputingとComputation. 似て非なる言葉だと思う. 同じように「計算」という意味だが、Computingがいわゆるコンピュータ、計算機での計算をさすのに対して、Computationは必ずしもコンピュータの関与を意味しない(が、それも含む)、より抽象的な意味での計算を意味するからだ. (参考: Computing vs Computation)

印象に残っている展示をいくつか書く。
・「りんごってどれくらい?」
りんごのサイズをイメージし、自分の手で円を作る。5秒後に、作った円のサイズは実際にどういうものか現れる。例えば、大きい円だと「マスクメロン 中」みたいなのが表示される。
・「速さの比較:マッハ1ってどれくらい?」
自分がマッハ1の速度で車を運転する疑似体験ができる。車を運転する動画がタイムラプスでマッハ1になるっぽい。
・「大工と曲尺」
大工が曲尺(L字型の定規)を使い、さまざまな形、量、長さなどを測る知恵を知る。例えば材木にななめに曲尺5cmの目盛りをあてると、5等分することができる。
・「ことば の おもみ」
天秤にかけて言葉の重さを測れる。文字の模型があり、それぞれの文字の重さが書かれている。

分かるだけでなく、体感できることは偉大だ。

ビデオをアスキーアートに変換するスクリプトを書いた

先週、和夫と田邊くんと飲んだ時に盛り上がって、各々なんかおもしろいことを形にして持ち寄ろうという話になった。
今日その会合があったので、デモを作った。

書いたのは、映像をアスキーアートに変換するブラウザアプリ。
HTMLのvideoタグを、JavaScriptであれこれする実装をしている。
エロ動画がアスキーアートになってて、はっきり分からないんだけど余計にエロい、みたいなものを以前に見たのだが、そこから着想を得ている。
# cbcnetで見たTHE.PSD SHOWの何かだったような記憶があるが、探してもみつからない。

デモ
動画ファイルをAAに変換するデモ
カメラ動画をAAに変換するデモ
<source>
※どちらもchrome最新版のみ動作確認済み

会合に集まる男どもが喜びそうなやつも作ってある。