CSVの文字化けを直すツール

文字化けしているCSVテキストの復元を試みます。

文字化けが起こると文字情報の欠落が起こることがあり、欠落している文字は復元が難しくなります。

特に「�」が付いた文字は復元できません。


■ 文字化けが起こる原理

たとえばUTF-8のファイルをShift-JISで開くと文字化けが起こります。

UTF-8やShift-JISというのは文字列のエンコーディングのことです。

パソコンは文字を数値として扱っており、文字列は数値の並びになっています。

この数値の並び方のことをエンコーディングと言います。

つまりUTF-8とShift-JISとでは数値の並び方が違っているわけです。

Webブラウザやエクセルなどは、デフォルトのエンコーディングでファイルを開きます。

このときデフォルトのエンコーディングと違うファイルを開いた場合は文字化けが起こることがあります。

文字化けしないようにするには、ファイルのエンコーディングとWebブラウザやエクセルなどのエンコーディングを合わせることです。


■ このツールの仕組み

UTF-8の文字列をShift-JISで開いた場合は文字化けが起こります。

この場合はShift-JISからUTF-8に再度変換することである程度の復元が可能になります。

ただし文字化けの過程で欠落した情報までは復元できません。