文字コード
文字コードは、バイトを読み取り可能な文字に解釈するプロセスです。UTF-8 は 2009 年以降主要なエンコーディングとなっており、事実上の標準として推進されています[1]。
目次
UTF-8
ターミナル
以下は UTF-8 をサポートするいくつかのターミナルのリストです。
- gnustep-terminal
- konsole
- mlterm
- rxvt-unicode
- st
- VTE ベースターミナル
- xterm - 引数として
-u8
を付けて実行するか、リソースxterm*utf8: 2
を設定してください。
Gnome-terminal または rxvt-unicode
これらのアプリケーションは、UTF-8 ロケールから起動する必要があります。そうでないと UTF-8 サポートがなくなります。上記の指示に従って en_US.UTF-8
ロケール(またはお使いのローカルの UTF-8 代替)を有効にし、デフォルトのロケールに設定した後、再起動してください。
URL encoding
URIs accept US-ASCII characters only and use percent-encoding to encode non-ASCII characters. This can result in very long and human-unreadable URIs.
In Firefox, it is possible to copy decoded URLs by enabling the browser.urlbar.decodeURLsOnCopy
flag in about:config
, or by inserting a space to the start of the URL, then selecting it (with the space) and copying it. However, this trick doesn't work on Chromium, and there is no equivalent flag. Alternatively, select starting at the end of the URL until right after the https://
part, then copy.
For command line usage, you can use python-urllib3 to translate encoded URLs from stdin.
$ python3 -c "import sys; from urllib.parse import unquote; print(unquote(sys.stdin.read().strip()))"
トラブルシューティング
- MP3 ファイルのエンコーディングの問題を修正するには、mp3unicode を使用してください。
抽出されたファイルのエンコーディングが間違っている場合
Windows の古いバージョン(XP、Vista、および 7)は、圧縮されたファイルの内容に対して異なるエンコーディングを使用します。展開するには、以下のコマンドを使用してください。
$ unzip -O CP932 file.zip