2013年3月25日月曜日

Randall Collins "Sociological Insight: An Introduction to Non-Obvious Sociology"

本屋で訳書を見つけて懐かしく思った。「脱常識の社会学」ということで、かなり昔から翻訳があった気がする。

基本的には社会学の入門書で、タイトルの通り、素人にとっては意外な社会学的洞察に満ちている。こういう本で「面白いなあ」と思ってもらえれば、社会学が常識を批判する最強のツールの一つであることが理解してもらえるというものである。まあ、実際の研究は、もっと地味なものではあるが。とっかかりとしては良いと思うが、問題はその先なのです・・・。

A nice introduction.

2013年3月14日木曜日

Q. Ethan McCallum "Bad Data Handbook: Cleaning Up the Data So You Can Get Back to Work"

データ解析の現場の事例集。Excel表の処理とかテキストマイニングとか統計データ処理など。業界でいうところの「データのクリーニング」みたいな話が多い。教科書的な統計理論とかデータベース理論の解説はない。むしろ、そういう理論をいくら究めても、現場はそんな綺麗事で済まないという点がテーマになっている。単純な話が、Excel表がRDBみたいに入力されていることはまずないわけだし、統計データが教科書通りに完璧に用意されていることもありえないわけだし等々。こういう現実のデータに如何に立ち向かうのかが、個別事例によって語られる。データ解析を仕事にしている人なら誰でも経験していることばかりだ。データのクリーニングなんか、ハッカー的な意味でカッコいい仕事でもないので、あまり公に語られることもなかったのだが、その意味では画期的な書籍と言えよう。もっとも、問題は個々の事例によって区々なので、体系的な対策はない。それらしい一般論を構築しようとしている章もあるが、現実はそんなに甘くない。仕事でデータ解析をしている人は読んで損はないだろう。と言っても、個人的には、特に参考になる技術とかはなかったが・・・。

それはそれとして、この本は、とある割と最近のTogetterに紹介されている。要は、「Excelを罫線ワープロとして使う事務屋は無能」と言っているだけで、こういうことを言う自称理系のナルシストに限って仕事ができないのを、わたしは良く知っている。ただの計算屋で、少しでもイレギュラーなデータが入っていたら、何もできなくなる人種である。どっちにしろ、この連中は実際にはこの本を読んでいないのだろう。読んでいたら、この本が連中とは全く逆の意図で書かれていることが分かるはずだからだ。そういう意味でも、できるだけ広く読んでもらいたい本だ。

A collection of cases of data cleaning. This book does not provide a general solution, though some chapters try to do so. Data cleaning is not a cool business. I guess that is why this kind of book has never written until now.

2013年3月11日月曜日

Onion Staff, Scott Dikkers "Our Dumb Century: The Onion Presents 100 Years of Headlines from America's Finest News Source"

20世紀の新聞抜粋による編年史。と言っても、まずは、The Onionのファンであることが前提だ。そしてファンであれば、この本がどういうものか想像がつくというものである。似た企画で"Our Dumb World"は地図帳で、これも面白かった。レビューした気がしていたが、忘れていたようだ。

If you are a "The Onion" fun, this book is a must-buy.

2013年3月10日日曜日

Drew Conway, John Myles White "Machine Learning for Hackers"

これは日本語タイトル「入門機械学習」のほうが適切で、実際に取り上げられるのは、スパムフィルタとか初歩的な統計的事象ばかりで、全体的に何もかも初心者向きである。多少コードが書ければ、"hacker"でなくても問題ないし、統計について全く無知でも問題ない。色々なデータを統計パッケージ"R"に食わせて遊ぼうというような程度。かなりの部分がRの解説のために割かれている。

個人的な意見としては、こういうことをやるのなら、まず対象となる事象について相当程度知っていないといけない。もっとも、機械学習の最大の魅力は、人間の専門家には思いつかないような発見をする点にあるので、変に知識がないほうが良いという考え方もありえるが、それにしても、確率統計理論の知識は必須だし、普通はこの時点である程度"R"に習熟しているはずだ。この本はその辺りの条件をすっ飛ばして、何も知らないまま、とりあえずデータを弄っている。眉をひそめるまで行かなくても、これで、この先何があるのかという疑問を持ってしまう。しかし、機械学習の概要を知るのには良いのかもしれない。

Maybe a good introduction for beginners.

2013年3月2日土曜日

R. Sales "Easy French Reader w/CD-ROM: A Three-Part Text for Beginning Students"

McGraw-Hill (2008/11/6)
978-0071603423

フランス語を学び始めた頃に読んだ本だけど、確かに良い本だったよ。一冊リーダーということなら、これがいい。

The best book of its kind; for beginners.