fbpx

メニュー

タグ: 自然言語処理

雑記

情報科学は未開人といかに接するべきか

立命館大学の論文がBLを含むpixivのR-18小説を無許可で有害な情報のサンプルとして晒し上げてして炎上という事件(?)があったので脊髄反射的に何も考えずに書くのですが…… 著作権法的には別に問題ない(引用の要件を満た […]

デザイン

Budouは日本語中央寄せの救世主なるか

先日、Googleのギッハブレポジトリに日本語の改行をなんかいい感じにするライブラリが公開され、ちょっとした話題になっています。その名もBudou。 なんでこんなライブラリがあるかというと、アルファベットの言語だとホワイ […]

読書日記

2014年に読んで一番感心した本『白と黒のとびら: オートマトンと形式言語をめぐる冒険』

この記事は12月1日〜24日までに僕が毎日ブログを更新する高橋文樹俺ベントカレンダーの4日目の記事です。 もう今年は本読まないのかというと、そんなことないのですが、たぶんこれだろうと思うのがあるので紹介します。 『白と黒 […]

プログラミング

MeCabのWordPressプラグイン作ってたけど挫折した

この記事は僕が毎年12月1日から24日までの間、気が向いたときにブログを書く高橋文樹俺ベントカレンダーの1日目です。 さて、最近Facebookで承認したアプリや文学フリマの売り上げなど、あらゆるものに裏切られてきて、W […]

プログラミング

WordPress+mroongaで全文検索

さて、以前WordPressでFULLTEXTインデックスを使った高速全文検索にトライという記事を書きましたが、その続きです。といっても、mroongaさえインストールできてしまえばどうということはないので、前述の記事の […]

プログラミング

WordPressでFULLTEXTインデックスを使った高速全文検索にトライ

生活に終われ、疲弊しきった不肖高橋です。海風薫る千葉の田舎町から大都会東京のコンクリートジャングルへと一人ゲルマン民族大移動を毎日繰り返した結果、加齢臭が強くなってきました。 昔は総武線でビール飲んでいるオジサンを見るた […]

Web制作

さらばdl原理主義者

僕たちが普段インターネットで目にするテキストの多くは、HTMLという言語で書かれています。あなたがいま目にしているこの文章もHTMLです。この段落をHTMLで表示するとこんな感じ。 <p>と</p&gt […]

告知

2012年高橋文樹.com10大ニュース

今年も残すところあと2時間、もうすぐ2012年が終わってしまいます。私的ニュースをまとめて振り返ってみたいと思います。 1. 千葉に引っ越した 今年の4月頃に都落ちを果たし、千葉へ引っ越しました。実家の近く、もともと生ま […]

読書日記

言語の真善美〜『ピダハン』を読んで

いまごく巷で話題沸騰の『ピダハン』をついに読みました。さすが「良書のみすず書房」ですねー。ちょうど僕がいま気になっていることとリンクしていたのであっという間に読み終えました。おもしろかったです。 ピダハンとは ネタバレ注 […]

Web制作

セマンティックが止まらない(主にGoogle)

Googleが4月ぐらいに発表したパンダアップデートで「これからはコンテンツのセマンティックな検索に注力していくよ」というようなことが発表されましたが、「セマンティックが止まらない」というギャグを言った30代のWeb業界 […]

翻訳

この図からベイジアンフィルタを作れば編集者はもういらないんだって

hon.jpのニュースで「書籍編集は単なる人力ベイジアン・フィルタ」出版社が公開した社内フロー図が作家たちの間で話題にという記事があったのですが、そこで紹介されている図が面白かったので訳してみました。大きい画像はこちら。 […]

プログラミング

Mac OS XにMegaMをインストールする

現在、文学機械を作るという使命感の元、自然言語処理を勉強するべく『入門 自然言語処理』を紐といています。 基本的にはPythonのNLTK(Natural Language Tool Kit)を使いながらお勉強していくの […]

高橋文樹ニュースレター

高橋文樹が最近の活動報告、サイトでパブリックにできない情報などをお伝えするメーリングリストです。 滅多に送りませんので、ぜひご登録お願いいたします。 お得なダウンロードコンテンツなども計画中です。