Uim を使って日本語を入力
このページでは uim を使った日本語入力の方法について説明しています。
もしあなたが SCIM を使う場合は Smart Common Input Method platform を参照して下さい。
目次
インストール
日本語入力を行うためには、次のパッケージが必要です。
日本語フォント
詳細については Fonts を参照して下さい。
おすすめの日本語フォントは以下の通りです。
- IPA フォント (AUR: テンプレート:Package AUR)
- 高品質かつ無償で利用できるアウトラインフォント。ゴシック体 (サンセリフ体) や明朝体 (セリフ体) グリフを含む。openSUSE の日本語ロケールの標準フォント。
- Takao フォント (AUR: テンプレート:Package AUR)
- IPAフォントの派生フォント。IPAフォントの問題をコミュニティによって速やかに修正することを目的としている。Ubuntu 日本語ローカライズ版 の日本語標準フォント。
- VL ゴシック (AUR: テンプレート:Package AUR)
- Debian や Fedora の日本語環境、Vine Linux などで採用されている標準フォント。
- UmePlus ゴシック (AUR: テンプレート:Package AUR)
- Mandriva Linux 日本語環境の標準フォント。
2ちゃんねるの Shift JIS アート を適切に表示したい場合、次のいずれかのフォントを使うと良いでしょう:
- IPAモナーフォント (AUR: テンプレート:Package AUR)
- Monapo フォント (AUR: テンプレート:Package AUR)
uim
pacman を使う
uim は次のコマンドでインストールできます。
# pacman -S uim
PKGBUILD を使ってソースから uim をコンパイル
次のような場合、ソースからコンパイルすべきです。
- Arch リポジトリのアップデートが待ちきれない場合。
Anthy (UTF-8) を使いたい場合。uim 1.6.0 時点で、Anthy (UTF-8) のサポートは標準では無効になっています (デフォルトの文字エンコーディングは EUC-JP)。- KDE を使っていて、uim-qt-tools を使いたい場合。Qt に関するすべてのツールは標準では無効になっています。
ここでは ABS を利用してソースからビルドする方法を説明します。
まず、ABS をインストールします:
# pacman -S abs
ABS を更新します:
# abs
それから、uim のディレクトリを $HOME 以下にコピーします。例えば:
$ cp -R /var/abs/extra/uim ~/sources/
次に、テンプレート:Filename を編集します。代表的なビルドオプションは次の通りです:
- Anthy (UTF-8) のサポートを有効にする。
- gnome-applet をビルドしない ― gnome-panel を makedepends および optdepends から外せます。
- Qt で動作する uim-tools をビルドする (Qt が必要)。
- Qt 用の UimQt (Qt immodule サポート) をビルドする (Qt が必要)。
PKGBUILD のサンプルを以下に示します。これは extra/uim 1.6.0 を基に、anthy-utf8 を有効にし、gnome-applet を無効にしたものです。
pkgname=uim-custom _pkgname=uim pkgver=1.6.0 pkgrel=1 pkgdesc='Multilingual input method library' arch=('i686' 'x86_64') url='http://code.google.com/p/uim/' license=('custom') depends=('m17n-lib' 'ncurses' 'gtk2') makedepends=('pkg-config' 'gettext' 'intltool') #makedepends=('pkg-config' 'gettext' 'intltool' 'gnome-panel') optdepends=('gnome-panel: for using the GNOME applet') options=('!libtool') install=uim.install provides=('uim') conflicts=('uim') source=("http://uim.googlecode.com/files/${_pkgname}-${pkgver}.tar.bz2" 'uim-home.patch') sha1sums=('d27f2ca8136da0702c82f0522911d06b2b8f8ea7' 'dbcf90f3ea246c5723d715e0935072baa9364cd2') build() { cd "${srcdir}/${_pkgname}-${pkgver}" # makechrootpkg runs build() as "nobody", which has HOME=/ # However, UIM's make needs $HOME to be writable. patch -p0 < ../uim-home.patch export HOME="`pwd`" ./configure --prefix=/usr --libexecdir=/usr/lib/uim \ --with-anthy-utf8 \ --disable-gnome-applet \ || return 1 make } package() { cd "${srcdir}/${_pkgname}-${pkgver}" make DESTDIR="${pkgdir}" install install -D -m644 COPYING "${pkgdir}/usr/share/licenses/${_pkgname}/COPYING" }
最後に、uim ディレクトリで makepkg を実行し、パッケージをビルドおよびインストールします。
$ makepkg -s -i
日本語入力システム
Anthy
Anthy はオープンソースの世界で最も知られているインプットメソッドの一つです。長い間メンテされていませんでしたが、2010年5月より Debian が引き継ぎました。
Anthy は以下のコマンドでインストールできます:
# pacman -S anthy
cannadic改
オリジナル Anthy のデフォルト辞書には EUC-JP (JISX0208) で定義されていない文字 (例えば "①" や "♥" など) は含まれていません。alt-cannadic はそれら文字を含んだ辞書を提供しています。
これを使用するには、cannadic改辞書をダウンロードし、テンプレート:Filename 配下に置いてください。
$ tar jxvf alt-cannadic-091230.tar.bz2 $ mkdir ~/.anthy/imported_words_default.d (if not exist) $ cp alt-cannadic-091230/extra/*.t ~/.anthy/imported_words_default.d/
詳細は公式サイトのwikiで確認してください。
Modified Anthy (anthy-ut)
Modified Anthy はオリジナル Anthy のかな漢字変換の品質向上を狙ったパッチ及び辞書のセットです。
Modified Anthy は、以下の2つのアップストリームからなっています:
PKGBUILD を使って Modified Anthy をコンパイル
Modified Anthy は AUR に テンプレート:Package AUR という名前で登録されています。
anthy-ut tarball を入手し、makepkg でビルド及びインストールします:
$ wget http://aur.archlinux.org/packages/anthy-ut/anthy-ut.tar.gz $ tar xvf anthy-ut.tar.gz $ cd anthy-ut $ makepkg -s -i
または、yaourt のような AUR ツールを使用します:
$ yaourt -S anthy-ut
すでに Anthy を使用していた場合は、既存の学習データのフォーマットを変換しなければなりません。
$ rm ~/.anthy/last-record1_*.bin $ anthy-agent --update-base-record $ rm ~/.anthy/last-record1_*.bin $ anthy-agent --update-base-record
(同じ事を2回繰り返していますが、間違いではありません)
Mozc
Mozc (AUR) は、Google日本語入力 のオープンソース版です。その辞書はGoogle日本語入力と異なり貧弱ですが、その範囲においては、複数文節の一括変換の品質が高いと言われています。他に、サジェスト機能などの特徴があります。Mozc は公式には ibus と scim にしか対応していませんが、macuim が uim-mozc プラグインを提供しており、AUR の テンプレート:Package AUR で利用可能です。
PKGBUILD を使って Mozc をコンパイル (uim から Mozc を使う)
まず mozc-svn の tarball を AUR から入手するか、yaourt のような AUR ツールを使用し、PKGBUILD を編集します。uim-mozc を有効にするには、以下のように テンプレート:Codeline の行をコメントから外してください。ibusを使用しないなら、テンプレート:Codeline の行をコメントアウトしてください:
## You can choose the input method framework to use either ibus, uim or both. ## If you will be not using ibus, comment out below. #_ibus_mozc="yes" ## If you will be using uim, uncomment below. _uim_mozc="yes" ## If you will be using scim, uncomment below. #_scim_mozc="yes"
日本の郵便番号辞書の構築 (オプション)
mozc は日本郵便 が提供する郵便番号データを辞書シードとしてインポートできます。
郵便番号を辞書に追加するには、PKGBUILD の テンプレート:Codeline の行をコメントから外してください:
## You can add Japanese zip code provided by Japan Post. ## If you want to use it, uncomment below. _zipcode="yes"
ビルド、インストール、そして登録
PKGBUILD の編集が終わったら保存し、ビルド及びインストールします:
$ makepkg -s -i
最後に、Mozc を uim に登録します。
# uim-module-manager --register mozc
Mozc をアンインストールしたときは、Mozcを登録解除してください。
# uim-module-manager --unregister mozc
設定
以下を ~/.xprofile、~/.xinitrc、~/.xsession などに設定します:
環境変数
export GTK_IM_MODULE='uim' export QT_IM_MODULE='uim' uim-xim & export XMODIFIERS=@im='uim'
ツールバーユーティリティ
UimToolbar を使用する場合は、以下のうちの一つを追加します。
uim-toolbar-gtk/qt
ウィンドウとして表示されるツールバーを使用する場合:
uim-toolbar-gtk &
uim を テンプレート:Codeline でビルドしている場合は、Qt用ツールバーも使えます:
uim-toolbar-qt &
uim-toolbar-gtk-systray
システムトレイ (通知エリア) に表示されるツールバーを使用する場合:
uim-toolbar-gtk-systray &
パネルアプレット
GNOME、Xfce を使用している場合、パネルアプレットのツールバーも使用できます。KDE 用もありますが、まだ安定版ではありません。Xfce の場合には xfce4-xfapplet が必要です。
uim の初期設定
以下のコマンドで uim の設定ウィンドウが表示されます :
$ uim-pref-gtk
「全体設定」の「標準の入力方式」で、Anthy、Anthy (UTF-8)、または Mozc を選択します。
テンプレート:Codeline を起動するか、X の再起動で uim を使用して日本語が入力できるようになります。
Emacs で uim を使う
uim は uim.el を提供しており、Emacs 上で uim を使用して日本語を入力できます。ここでは、Emacs 上で uim を、文字コーディング UTF-8 で使用する設定を説明します。
詳細は 公式 wiki 参照してください。
なお、Anthy も Mozc もそれぞれ Emacs で日本語入力を行うフロントエンド anthy.el や mozc.el を提供しています。uim.el を使用するメリットは、インプットメソッドを変更しても テンプレート:Filename の修正が (ほとんど) 不要であることと、変換候補をインラインで表示できること (制限あり) が挙げられます。
LEIM かマイナーモードか
uim.el を使用する場合、直接マイナーモードで使用するか、LEIM を使用するかを選択できます。uim.el とそれ以外の IM をよく切り替えて使う場合は LEIM フレームワークを使用してください。
マイナーモードで使うための設定
マイナーモードで使用する場合は、以下の設定を テンプレート:Filename あるいはその他の Emacs カスタム設定用ファイルに追加します。
;; read uim.el (require 'uim) ;; uncomment next and comment out previous to load uim.el on-demand ;; (autoload 'uim-mode "uim" nil t) ;; key-binding for activate uim (ex. C-\) (global-set-key "\C-\\" 'uim-mode)
LEIM で使うための設定
LEIM で使用する場合は、以下の設定を テンプレート:Filename あるいはその他の Emacs カスタム設定用ファイルに追加し、使用するかな漢字変換エンジンをデフォルトに指定します。
;; read uim.el with LEIM initializing (require 'uim-leim) ;; set default IM. Uncomment the one of the followings. ;(setq default-input-method "japanese-anthy-utf8-uim") ; Anthy (UTF-8) ;(setq default-input-method "japanese-mozc-uim") ; Mozc
既定の文字エンコーディングの指定
uim.el はデフォルトの文字エンコーディングを EUC-JP としていますが、UTF-8 を使用する Anthy (UTF-8) や Mozc を使用する場合は都合が悪いので UTF-8 に変更します。以下の設定を テンプレート:Filename あるいはその他の Emacs カスタム設定用ファイルに追加してください。
;; Set UTF-8 as preferred character encoding (default is euc-jp). (setq uim-lang-code-alist (cons '("Japanese" "Japanese" utf-8 "UTF-8") (delete (assoc "Japanese" uim-lang-code-alist) uim-lang-code-alist)))
インライン変換候補表示機能をデフォルトで有効にする
変換候補を入力中の文字列のすぐ下(もしくはすぐ上)に縦方向に並べて表示させる場合は以下の設定を テンプレート:Filename あるいはその他の Emacs カスタム設定用ファイルに追加します。
;; set inline candidates displaying mode as default (setq uim-candidate-display-inline t)
入力モードの初期値をひらがな入力にする
uim.el 起動時の入力モードをひらがな入力にする場合は、以下のように テンプレート:Filename あるいはその他の Emacs カスタム設定用ファイルを、使用するインプットメソッドに合わせて編集します。
;; Set Hiragana input mode at activating uim. (setq uim-default-im-prop '("action_anthy_utf8_hiragana" "action_mozc_hiragana"))
Emacs 上で C-SPC が IM のオン・オフで使われてしまうのを防ぐ
デスクトップ環境上で IM のオン・オフのキー割り当てに C-SPC を設定しており、Emacs 上でもそちらが優先されて C-SPC/C-@ で set-mark-command が使えなくて困る、という場合は、テンプレート:Filename か テンプレート:Filename に以下を追加してください。
Emacs*UseXIM: false
トラブルシューティング
Opera で日本語入力ができない
Opera で日本語が入力できない場合は、以下のように環境変数を変更してみてください:
export QT_IM_MODULE='xim'
uim-toolbar-gtk-systray: トレイアイコンがつぶれてます
freedesktop.org のシステムトレイ仕様では、ひとつのアプリケーションに与えるスペースはアイコン1個分のみとなっていますが、uim はそこにデフォルトのツールバーアイコン4,5個をまとめて表示しようとするために潰れてしまいます。ツールバーに表示するアイコンを1個だけにすることで解決します。以下は、入力モードアイコンのみを表示させる例です:
- テンプレート:Codeline を起動する。
- 「グループ」の中から「ツールバー」を選択する。
- 「入力方式切り替えメニュー」および「ボタン」ボックスの中のすべてのチェックボックスのマークを外す。
- 「グループ」の中から、使用する入力メソッド (Anthy、Anthy (UTF-8)、またはMozc)を選択する。
- 「ツールバー」ボックスの「有効にするボタン」の右端にある「編集」ボタンをクリックする。
- 「入力モード」のみ有効にする。
- 「OK」をクリックして設定ウィンドウを閉じる。
トレイアイコンは "あ" (ひらがな入力) または "ー" (直接入力) になっているはずです。
暗いテーマを使用しているので uim のモードアイコンが見えません
暗いテーマ用のアイコンを使用します (uim 1.6.0 以降)。
- テンプレート:Codeline を起動する。
- 「グループ」の中から「ツールバー」を選択する。
- 「アイコン」ボックスの「濃色背景向けアイコンを使用する」にチェックマークをつける。
- 「OK」をクリックして設定ウィンドウを閉じる。