立命館大学の論文がBLを含むpixivのR-18小説を無許可で有害な情報のサンプルとして晒し上げてして炎上という事件(?)があったので脊髄反射的に何も考えずに書くのですが…… 著作権法的には別に問題ない(引用の要件を満た […]
先日、Googleのギッハブレポジトリに日本語の改行をなんかいい感じにするライブラリが公開され、ちょっとした話題になっています。その名もBudou。 なんでこんなライブラリがあるかというと、アルファベットの言語だとホワイ […]
この記事は12月1日〜24日までに僕が毎日ブログを更新する高橋文樹俺ベントカレンダーの4日目の記事です。 もう今年は本読まないのかというと、そんなことないのですが、たぶんこれだろうと思うのがあるので紹介します。 『白と黒 […]
この記事は僕が毎年12月1日から24日までの間、気が向いたときにブログを書く高橋文樹俺ベントカレンダーの1日目です。 さて、最近Facebookで承認したアプリや文学フリマの売り上げなど、あらゆるものに裏切られてきて、W […]
さて、以前WordPressでFULLTEXTインデックスを使った高速全文検索にトライという記事を書きましたが、その続きです。といっても、mroongaさえインストールできてしまえばどうということはないので、前述の記事の […]
生活に終われ、疲弊しきった不肖高橋です。海風薫る千葉の田舎町から大都会東京のコンクリートジャングルへと一人ゲルマン民族大移動を毎日繰り返した結果、加齢臭が強くなってきました。 昔は総武線でビール飲んでいるオジサンを見るた […]
僕たちが普段インターネットで目にするテキストの多くは、HTMLという言語で書かれています。あなたがいま目にしているこの文章もHTMLです。この段落をHTMLで表示するとこんな感じ。 <p>と</p> […]
今年も残すところあと2時間、もうすぐ2012年が終わってしまいます。私的ニュースをまとめて振り返ってみたいと思います。 1. 千葉に引っ越した 今年の4月頃に都落ちを果たし、千葉へ引っ越しました。実家の近く、もともと生ま […]
いまごく巷で話題沸騰の『ピダハン』をついに読みました。さすが「良書のみすず書房」ですねー。ちょうど僕がいま気になっていることとリンクしていたのであっという間に読み終えました。おもしろかったです。 ピダハンとは ネタバレ注 […]
Googleが4月ぐらいに発表したパンダアップデートで「これからはコンテンツのセマンティックな検索に注力していくよ」というようなことが発表されましたが、「セマンティックが止まらない」というギャグを言った30代のWeb業界 […]
hon.jpのニュースで「書籍編集は単なる人力ベイジアン・フィルタ」出版社が公開した社内フロー図が作家たちの間で話題にという記事があったのですが、そこで紹介されている図が面白かったので訳してみました。大きい画像はこちら。 […]
現在、文学機械を作るという使命感の元、自然言語処理を勉強するべく『入門 自然言語処理』を紐といています。 基本的にはPythonのNLTK(Natural Language Tool Kit)を使いながらお勉強していくの […]