Diary?::2005-10-07

00:25

俺の回りの連中は、mixiと外部の日記とで更新頻度が違うというか、ほぼどっちかでしか書いていないのが多い。やっぱみんなそこまで書くことがないのだろう。

ああ、俺の日記の分量が多いのは同じようなことを繰り返し書いているからだという気がしてきた。でもいちいち昔の日記を調べるのもねえ。

あー、検索システムを作ればいいのか。超面倒臭いけど。Google検索? Googleサマが拾ってくれねえんだよ!

01:33

MyspaceとかいうサービスらしきものにてNortherの最新EPが聴き放題だ。3rdが素晴らしい出来で4thはどうなるのかと思っていたが、この分だとかなり期待してもいいな。

ところでNortherはドラムが抜けたらしい。俺はPetriとTsuomasがいれば、いやPetriがいれば問題ないと思っているから痛手ではないが。

01:38

今の世の中、やはりGoogleに拾われていないサイトには価値がないのだろうな。だってそういうサイトは誰にも存在を知られないのだから、存在しない物に価値を求めることが出来ない以上、検索に引っかからないサイトは無価値だ。……本当に?

俺は卒論で検索エンジンの研究(といっても全然対したことではない。RDFを用いた検索エンジンとか、そういうお花畑の話)をしている関係で常に思っていることだが、特定のページに機械的にランク付けをすることは、果たして良いことなのか。ここでの良いことというのは、過半数の人が検索結果に満足するかという意味だ。そしてそれは、きっと良いことなのだろう。

でも情報はいずれ古くなるわけで、いつかは新しいサイトの情報が検索結果の上位に出てこないとまずい。勿論、質の高く、情報の新しいサイトが。でもそんなことが可能なのか、未だに疑問だ。結局のところ、どれだけリンクされているかでページの価値を決めている部分がある以上、一度傾いたシーソーを戻すことはかなり難しいんじゃないか。

じゃあ新しく出来たページをどうやって探すかだが、はてなダイアリーならキーワードを辿って行き着くことができるし、その手のサービスなら検索で見付けることが容易だ。でも、ブログサービス以外のサイトはどうするのだろう。むしろ、そっちの方が需要がありそうなのだが。

例によって投げっ放しで終わるが、案外P2Pがその答えになるんじゃないかと、そんな気がしている。具体的なアイディアなんて全然ないし、かなりの思い付きなのだが。

05:04

気の迷いでjnethackをプレイ。いやー、久しぶりにハードコアなゲームをプレイしたよ。恐らく近代的なRPGのファンには理解できないだろうし別に理解できたからって偉くもないのだが、俺はこういう殺伐としたRPGの方がよりRPGらしいと思える。ぶっちゃけ紙芝居だのポリゴン寸劇だのは見てても退屈なのが多いし。

個人的には、ブレスオブファイア4みたいなグラフィックでハードコアなRPGをやってみたい。でもそうなると、操作性の快適さが落ちるか?

15:34

オタクの特性を重力場でたとえてみたりと、案外はっちゃけた記事。俗に言うアキバ系がオタクとイコールの御時世に、オタクってのはどんなジャンルにもいるんだと主張して、さらにその市場規模まで推測しているのはポイント高し。

22:21

転置インデックスを作成するときなどにはbigramというトークン分割を行う場合がある。これは文字列を2文字ごとに分割して見ていくという方式なのだが、Pythonで実装してみた。

#!/usr/bin/env python
def get_bigram(text):
	hash = {}
	for i in range(len(text)-1):
		bg = text[i:i+2]
		try:
			hash[bg] += 1
		except:
			hash[bg] = 1
	return hash

def get_bigram2(text):
	hash = {}
	for i in range(len(text)-1):
		bg = text[i:i+2]
		hash[bg] = hash.get(bg, 0)+1

if __name__ == "__main__":
	import time
	text = unicode(file("tmp.txt").read())
	t = time.time()
	get_bigram(text)
	print "Bigram  :", time.time()- t 
	t = time.time()
	get_bigram2(text)
	print "Bigram2 :", time.time()- t 

結果としては、get_bigram2の勝ち。

Written by Kuwata Chikara
Creative Commons