SSブログ

分散型検索エンジン "YaCy" が正式に日本語化されました。 [P2P検索エンジン YaCy]

検索の為の索引を各自の端末に分散させ、P2P通信技術を用いる事で、検閲される事を防ぐ事が出来るインターネット検索エンジンが " YaCy " (ヤスィー)です。

"YaCy" の公式ウェブサイトのURL:
http://yacy.net/en/index.html

" YaCy " はドイツ発祥で、オープンソースで開発されたものです。
全世界で広く使われている全文検索エンジンの " Solr " が組み込まれております。
また、Windows, Mac, Linux系の端末で使う事が出来ます。
使用するにはJava VMがインストールしてある必要があります。

私は1年以上前から今日までこの検索エンジンを使用させてもらっております。

"YaCy" は多言語に対応しており、日本語での検索も当然そのまま可能です。

しかしながら今までは設定画面等のインターフェースは、英語、ドイツ語、フランス語、中国語、ロシア語、ウクライナ語、ヒンディー語に対応しておりますが日本語には対応しておりませんでした。

そこで私はYaCyに添付されている翻訳ファイルを使ってインターフェースの日本語翻訳を試みました。

YaCy_SS_(2016_02_15)_1_Edited_1 分散型インターネット検索エンジンの "YaCy" の管理画面のスクリーンショット画像。日本語表示されている。
https://c2.staticflickr.com/2/1450/25041322776_bc871ed287_o.png

翻訳はまだ不完全ですが、私はこれを開発用のソースコード管理サーヴィスの " GitHub " にて " Pull Request " 致しまして、昨日、開発者の方がそれを正式に " YaCy " の最新の開発版アップデートに統合して下さいました。

YaCyを最新開発版にアップデートした後、YaCyの " Administration " 画面の左のコラムの " First Steps " の " Use Case & Account " をクリックして、 " Select a language for the interface: " で " 日本語 " を選択して下さい。直ぐに日本語表示される筈です。
但し、まだ翻訳は不完全ですので、日本語化されるのは一部のメニューのみである事を御了承下さい。


YaCyの導入の仕方やアップデートの仕方等につきましては以前の私の記事を御覧下さい。

[ブログ記事]
検索エンジン "YaCy" は実用性充分です。
http://crater.blog.so-net.ne.jp/2015-10-15

分散型検索エンジン YaCy の導入解説
http://crater.blog.so-net.ne.jp/2015-07-21

分散型検索エンジン YaCy のアップデート
http://crater.blog.so-net.ne.jp/2015-06-25

分散型検索エンジンYaCyについての解説動画
http://crater.blog.so-net.ne.jp/2015-03-22

Ubuntu PCでYaCy検索エンジンの為のポート開放の設定
http://crater.blog.so-net.ne.jp/2014-11-06


" YaCy " の開発用GitHub ページのURL:
https://github.com/yacy/yacy_search_server

コメント(9)  トラックバック(1) 

コメント 9

なでしこ

暗号とプライバシーに興味があります。
非力ながら開発もやっています。
http://github.com/anang0g0
グーグルの検索結果に疑問があって分散型検索エンジンを探したら見つかったので早速使っています。
でもデータベースが貧弱なのか使い物になりません。
今後の発展に期待します。
by なでしこ (2016-04-27 20:43) 

Sutraus

なでしこ 様、はじめまして。
YaCyのインデックスのデータベース(DHT, 分散ハッシュテーブル及びRWI, 転置インデックス)はP2Pネットワークによりピア同士で共有されます。これは自動的にゆっくりと(ネットワーク等のリソースを占有しない為に遅くしてあるようです。)行われます。
また、自分自身でウェブをクロールさせてインデックスを作成させる事が出来ます。
スノーデン ファイル暴露事件当時はピアが沢山居たのですが、今では日本人は1、2人です。その為、ネットワーク全体の日本語のデータベースは特に小さくなってしまいました。
尚、私の端末上ではデータベースが充分に大きい為、サクサクと検索が可能です。
YaCyを使い始めてから1週間以上経てば受け取るDHTとRWIのデータベースが大きくなり、まともに使えるようになると思います。

暗号は非常に重要な分野ですので、ぜひとも開発を頑張って下さい。応援致します!

by Sutraus (2016-04-27 22:41) 

Sutraus

もう一つ、YaCyでは検索結果のランキングについて重み付けを変える事が出来ます。私はページのタイトルやURLの短さやURLに含まれる単語、他のドメインからの被リンク数を重視した重み付けにしております。
by Sutraus (2016-04-27 23:04) 

Sutraus

忘れておりましたが、YaCyをダウンロードした直後はヴァージョンが古いですので、手動で最新の開発版にアップデートすると格段に高速化、高機能化致しますよ。
by Sutraus (2016-05-02 13:40) 

go-ya

はじめまして。
しばらく前から Yacy を使い始めたのですが、インストールして検索するとメモリ使用量がいっきに2GB近く上昇します。これは私の環境だけでしょうか。それとも最初はこんなもので時間の経過とともに落ち着く現象でしょうか。
by go-ya (2017-06-25 20:36) 

Sutraus

go-ya さん、お返事が遅れてすみません。
YaCyの管理ページ(Administration)は見られますでしょうか。
管理ページの左のコラムの "初めの一歩" / "RAM/ストレージの使用方法 & 更新" の項目の "Performance" を選択して "Resource Observer" / "RAM" / "Minimum required [ ] MiB free space. Disable DHT-in below. " のところの数値を256や512といった少ない値にしてみると改善するかもしれません。

YaCy自体が自分の端末をP2P サーヴァーにするので、もしかすると、常にある程度のメモリーを消費するのかもしれません。

実は私のPCは32GBのメモリーを積んでいて、数GBの変化がわかりづらくて、はっきりとした事が言えないのです。

何はともあれ、YaCyを試して頂いてとても嬉しく思います。
by Sutraus (2017-06-28 09:44) 

お名前(必須)

あざまーす。自分で作る必要がないって素晴らしい()
そろそろ検索エンジンがDMCAのせいで、使いづらくなってたもので、乗り換え先さがしてたましたが、日本語対応しないと、技術者以外に布教しづらいので助かります。
by お名前(必須) (2017-09-18 22:41) 

お名前(必須)

yacyとtor browserを比べてyacyがいいところってどこでしょうか。
by お名前(必須) (2017-11-23 19:30) 

Sutraus

2017-11-23 19:30の方へ。
YaCyとTor Browserではその目的が異なります。

tor browserは通信経路を隠匿することにより、アクセス元である自分自身を隠匿する目的で使われるものです。

対してYaCyはインターネット検索システムであり、Google検索エンジンなどと異なり、企業や政府による検閲(情報統制)を受けず、検索結果を不正に操作される事を防ぎます。
ユーザーが求める情報へ辿り着く事を妨げない為のものです。

たとえばジャーナリストの方であれば、両方使うと良いかもしれません。
by Sutraus (2017-11-28 21:24) 

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

※ブログオーナーが承認したコメントのみ表示されます。

トラックバック 1

PCが起動しません。価値観。 ブログトップ

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。