とあるIT屋の独白

ITや経営について主に書きます

テキストファイルの仕組み

仕事でいろいろな業務ソフトを使ってると、テキストファイルに触れる機会も多いかと思います。テキストファイルを開くときはメモ帳やいろいろなエディタを使いますが、そもそもテキストファイルで日本語がなぜ読み書きできるのか、気になったことはないでしょうか(私は一昔前に気になりました…)。まずは基本的な仕組みは、以下の記事に書いてあります。

 

【テキストファイルとバイナリファイル】

https://codezine.jp/article/detail/7915

 

テキストファイルも突き詰めると0と1の羅列なわけで、対応した文字コードで読み取らないと文字化けが発生するということですね。システム屋としては、一昔前はこの文字化けにかなり悩まされた部分もあったのですが、最近はUnicode化もずいぶんと進んで来た感があるので最近はそんなには悩まされることも少なくなってると思います。。

 

UTF-8の普及率が60%を突破、ASCIIも含めれば80%に近づく】

http://s.news.mynavi.jp/news/2012/02/09/027/index.html