« 携帯電話料金を考える | メイン | 今こそ!Windows再インストール!! »

2005年03月11日

Googleキャッシュの文字化け

 毎度おなじみのKACKUNです。
 最近、Googleでキャッシュされたページを開くと、物凄い文字化けに遭遇するようになりました。IEだけかと思ったらMozillaでもそうですね。
 結論から言うと、これはGoogle側で付与されるCharsetと、実際にGoogle側から出力される内容に矛盾が生じているためのようです。
 KACKUN.comのトップページはエンコードがShift_JISですが、キャッシュを見るとUnicodeで出力されている模様。変換されているのかしら?にも関わらず、Googleキャッシュの1行目に<meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS">なんて記載されているからさあ大変[^^;;]。UTF-8で出力しておいてShift_JISだよーなんて言ってしまうのはマズいのでは。いや、普通にマズい。
 この結果ブラウザは「あ、このページはShift_JISなんだ」と思い展開、しかし実際中身はUTF-8なのでエンコードが違い、究極の文字化け地獄へ突入というわけです。
 他のサイトなどで確認してみたところ、どうやらこの一行目は実際にキャッシュした時のエンコードを出力しているようです。そのため、元々euc-jpだったページはちゃんとeuc-jpと出力されていますし、iso-2022-jpなページもiso-2022-jpと出力されます。しかし、折角charsetを出力しても中身は常にUTF-8。どうしたものか。

 対策としては、とりあえずキャッシュを開いたら、ブラウザのエンコードをUnicode(UTF-8)に切り替えましょう(爆)。Google側で<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">と出力するようにしてくれれば良いのですが。いや、むしろこれは全員UTF-8へ移行しようというGoogleのメッセージなのでしょうか!?[^^;;]

 なんだかんだ言いつつShift_JISを使い続けているKACKUNでした。(ぉ

投稿者 KACKUN : 2005年03月11日 07:57

トラックバック

このエントリーのトラックバックURL:
http://www.kackun.com/mt/mt-tb.cgi/220

コメント

コメントしてください




保存しますか?