MT形式については次に書いてありますが、自然言語のみの記述なんでイマイチ厳密性に欠けますなー。
セマンティクスでも、CATEGORY:とTAGS:の使い分けがわかりません。はてなダイアリーではCATEGORY:だけを使っています。仕様では、EXCERPT:(概要)とかKYEWORDS:もあるんですね。トラックバックはPING:。だけど、はてなダイアリーではトラックバックは削除されるのでした。
今日わかったことは、MT形式だと自分が書いたコメントがなぜか削除されることです。XML形式とCSV形式ではそういうことはありません。変ですよね。今まで誰も文句を言わなかったのでしょうか? ダウンロード・データなんて、誰もまともに扱おうとしてないってことかも知れませんね。
お引越しに使うくらい?
まともに扱えないデータだから誰も扱わないのか、誰も扱おうとしないからまともじゃないのか …?
ある程度の量のブログデータを、まともに処理する(「まとも」って何? って話はあるけど)って、ほんとに大変ですよ。メタデータや構造を後から与えよう、なんて思うのは僕だけかもしれない。いや、思う人はいるだろうけど、なかなか実行できないですよ。(僕も挫けそうだよ…)