Home
Packages
Forums
Wiki
GitLab
Security
AUR
Download
コンテンツにスキップ
メインメニュー
メインメニュー
サイドバーに移動
非表示
案内
メインページ
目次
コミュニティに貢献
最近の出来事
おまかせ表示
特別ページ
交流
ヘルプ
貢献
最近の更新
最近の議論
新しいページ
統計
リクエスト
ArchWiki
検索
検索
表示
アカウント作成
ログイン
個人用ツール
アカウント作成
ログイン
Hadoopのソースを表示
ページ
議論
日本語
閲覧
ソースを閲覧
履歴を表示
ツール
ツール
サイドバーに移動
非表示
操作
閲覧
ソースを閲覧
履歴を表示
全般
リンク元
関連ページの更新状況
ページ情報
表示
サイドバーに移動
非表示
←
Hadoop
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
[[Category:分散コンピューティング]] {{Related articles start}} {{Related|Apache Spark}} {{Related articles end}} [[en:Hadoop]] [[zh-hans:Hadoop]] [http://hadoop.apache.org Apache Hadoop] はコモディティハードウェアによる巨大なクラスタ上でアプリケーションを実行するためのフレームワークです。Hadoop フレームワークは透過的にアプリケーションに信頼性とデータモーションを提供します。Hadoop は Map/Reduce という名前の計算パラダイムを実装しています。そこではアプリケーションは多数の小さな欠片に分割して、クラスタ内のノード上でそれぞれを実行・再実行できるようにします。さらに、Hadoop は計算ノード上にデータを保存するための分散ファイルシステム (HDFS) を備えており、クラスタ全体で非常に高い帯域を実現します。MapReduce と Hadoop Distributed File System はどちらもノードでのエラーをフレームワークによって自動的に処理できるように設計されています。 == インストール == {{AUR|hadoop}} パッケージをインストールしてください。 == 設定 == デフォルトで、hadoop は擬似分散操作ができるように設定されています。{{ic|/etc/profile.d/hadoop.sh}} には伝統的な hadoop とは異なる値が設定されている環境変数があります。 {| class="wikitable" |- ! scope="col"| 環境変数 ! scope="col"| 値 ! scope="col"| 説明 ! scope="col"| パーミッション |- | HADOOP_CONF_DIR | {{ic|/etc/hadoop}} | 設定ファイルが保存されるディレクトリ。 | 読み取り |- | HADOOP_LOG_DIR | {{ic|/tmp/hadoop/log}} | ログファイルが保存されるディレクトリ。 | 読み書き |- | HADOOP_SLAVES | {{ic|/etc/hadoop/slaves}} | リモートスレーブホストが指定されているファイル。 | 読み取り |- | HADOOP_PID_DIR | {{ic|/tmp/hadoop/run}} | pid ファイルが保存されるディレクトリ。 | 読み書き |} また、以下のファイルを正しく設定する必要があります。 /etc/hosts /etc/hostname /etc/locale.conf {{ic|/etc/hadoop/hadoop-env.sh}} で {{ic|JAVA_HOME}} を設定する必要があります。デフォルトで使用されるディレクトリは Arch Linux でインストールされるディレクトリと異なっているため必須です: {{hc|1=/etc/hadoop/hadoop-env.sh|2=export JAVA_HOME=/usr/lib/jvm/java-8-openjdk/}} == シングルノード設定 == {{Note|このセクションは [http://hadoop.apache.org/docs/stable/ Hadoop の公式ドキュメント] に基づいています。}} === スタンドアロン操作 === デフォルトでは、Hadoop は単一の Java プロセスで動作するように設定されています。デバッグする場合に有用です。 以下は conf ディレクトリを input としてコピーして使用する例で、正規表現にマッチする文字列を全て出力します。出力は output ディレクトリに書き込まれます。 $ HADOOP_CONF_DIR=/usr/lib/hadoop/orig_etc/hadoop/ $ mkdir input $ cp /etc/hadoop/*.xml input $ hadoop jar /usr/lib/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.0.jar grep input output 'dfs[a-z.]+' $ cat output/* === 擬似分散操作 === シングルノードでも Hadoop デーモンを複数の Java プロセスで動作させる擬似分散モードを使うことができます。 デフォルトでは、Hadoop は root ユーザーで実行されます。{{ic|/etc/conf.d/hadoop}} でユーザーを変更することができます: HADOOP_USERNAME="<your user name>" ==== パスフレーズの要らない ssh の設定 ==== [[sshd]] が有効になっていることを確認してください。有効になっていない場合は {{ic|systemctl enable sshd}} で有効にします。そしてパスフレーズを入力しなくてもローカルホストに接続できることを確認: $ ssh localhost パスフレーズがないとローカルホストに ssh できない場合、以下のコマンドを実行してください: $ ssh-keygen -t rsa -P "" -f ~/.ssh/id_rsa $ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys2 $ chmod 0600 ~/.ssh/authorized_keys また、{{ic|/etc/ssh/sshd_config}} の以下の行がコメントアウトされていることを確認してください: {{hc|/etc/ssh/sshd_config| #AuthorizedKeysFile .ssh/authorized_keys}} ==== 実行 ==== 新しい分散ファイルシステムをフォーマット: $ hadoop namenode -format 次の hadoop の systemd ユニットを[[起動]]してください: {{ic|hadoop-datanode}}, {{ic|hadoop-jobtracker}}, {{ic|hadoop-namenode}}, {{ic|hadoop-secondarynamenode}}, {{ic|hadoop-tasktracker}}。 hadoop デーモンのログ出力は {{ic|<nowiki>${HADOOP_LOG_DIR}</nowiki>}} ディレクトリに書き込まれます (デフォルトでは {{ic|/var/log/hadoop}})。 NameNode と JobTracker のウェブインターフェイスを開いてください。デフォルトでは以下の URL になります: * NameNode - http://localhost:50070/ * JobTracker - http://localhost:50030/ input ファイルを分散ファイルシステムにコピー: $ hadoop fs -put /etc/hadoop input サンプルを実行: $ hadoop jar /usr/lib/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep input output 'dfs[a-z.]+' output ファイルを確認: 分散ファイルシステムからローカルファイルシステムに output ファイルをコピーして確認: $ hadoop fs -get output output $ cat output/* または、分散ファイルシステムから output ファイルを確認: $ hadoop fs -cat output/* テストが完了したら、以下のコマンドでデーモンを停止します: # systemctl stop hadoop-datanode # systemctl stop hadoop-jobtracker # systemctl stop hadoop-namenode # systemctl stop hadoop-secondarynamenode # systemctl stop hadoop-tasktracker
このページで使用されているテンプレート:
テンプレート:AUR
(
ソースを閲覧
)
テンプレート:Hc
(
ソースを閲覧
)
テンプレート:Ic
(
ソースを閲覧
)
テンプレート:META Related articles start
(
ソースを閲覧
)
テンプレート:Note
(
ソースを閲覧
)
テンプレート:Related
(
ソースを閲覧
)
テンプレート:Related articles end
(
ソースを閲覧
)
テンプレート:Related articles start
(
ソースを閲覧
)
Hadoop
に戻る。
検索
検索
Hadoopのソースを表示
話題を追加