このブログの更新は Twitterアカウント @m_hiyama で通知されます。
Follow @m_hiyama

メールでのご連絡は hiyama{at}chimaira{dot}org まで。

はじめてのメールはスパムと判定されることがあります。最初は、信頼されているドメインから差し障りのない文面を送っていただけると、スパムと判定されにくいと思います。

参照用 記事

続・はてなダイアリーのダウンロード・データ

MT形式については次に書いてありますが、自然言語のみの記述なんでイマイチ厳密性に欠けますなー。

セマンティクスでも、CATEGORY:とTAGS:の使い分けがわかりません。はてなダイアリーではCATEGORY:だけを使っています。仕様では、EXCERPT:(概要)とかKYEWORDS:もあるんですね。トラックバックPING:。だけど、はてなダイアリーではトラックバックは削除されるのでした。

今日わかったことは、MT形式だと自分が書いたコメントがなぜか削除されることです。XML形式とCSV形式ではそういうことはありません。変ですよね。今まで誰も文句を言わなかったのでしょうか? ダウンロード・データなんて、誰もまともに扱おうとしてないってことかも知れませんね。

お引越しに使うくらい?

まともに扱えないデータだから誰も扱わないのか、誰も扱おうとしないからまともじゃないのか …?

ある程度の量のブログデータを、まともに処理する(「まとも」って何? って話はあるけど)って、ほんとに大変ですよ。メタデータや構造を後から与えよう、なんて思うのは僕だけかもしれない。いや、思う人はいるだろうけど、なかなか実行できないですよ。(僕も挫けそうだよ…)