2017年7月21日金曜日

Nyafoo!、リブランドのお知らせ(真面目になる)

Nyafoo!を公開して2週間が過ぎました。
予想外に反響があり、さすがに名前がまずいと思っておりました。

大日本印刷が「Shufoo!」というギリギリな名称のサービスを続けており、「Fにしておけば大丈夫だろう」と軽く付けたサービス名だったのです。

しかし、このまま進むとまずい。
Shufoo!はチラシサイトだけど、こっちは検索エンジンです。
業態がバッティングしています。
まずい。

そこで、早めにリブランドしました。

新しい名称はojizo(オジゾー)とします。
ドメインも素直にojizo.jpです。

知恵の神のomoikaneも良かったのですが、こちらは先約がおりました。
だいたい、神様を名乗るのもおこがましいか。

こじんまりと、近所のお地蔵さんぐらいの存在をめざそう。
そんな思いを込めて、インターネットのojizoをめざします。

これからも、ojizoをよろしくお願いいたします。

2017年7月19日水曜日

Nyafoo!の処理能力と実用的な検索エンジン

実用的な検索エンジンには、どれぐらいのインデックスが必要なのでしょうか。

20年ほど前のロボット検索エンジン、gooやinfoseekでも1,000万件以上のURLをインデックスしていたはずです。
現在のNyafoo!のインデックス数は160万件前後ですから、少なく見積もっても現在の10倍ぐらいのURLを集める必要がありそうです。

ストレージは500GBぐらい用意すれば収まるでしょう。こっちはEBSで随時拡張できますから問題なさそうです。

elasticsearchはクラスタをうまく作れば、数千万件のインデックスを実用的な速さで処理できるので、上限は問題ないでしょう。実際に突っ込んでみないと分からないことがあると思いますが。

Nyafoo!は24時間で100万URLを処理する能力があります。それでも、目標のインデックスを周回するのに2週間以上かかる計算です。

現在は、形態素の辞書を鍛えながら周回しているため、インデックスの寿命を短く設定しています。形態素が賢くなり、インデックスの総数が増えてきたら、寿命を徐々に伸ばす感じでしょうか。

1,000万URLというと膨大な感じがしますが、官公庁・自治体、上場企業とグループ企業、主要マスコミ、各種の公式サイトだけで達成できそうです。

2017年7月18日火曜日

2017年7月18日16時ごろ、障害が発生しました

本日、Nyafoo!に障害が発生しました。お詫びいたします。

■発生した障害
10分程度のアクセス不能
サイトデザインの乱れ

■原因
Fessのバージョンアップ作業の手違い

■現在の状況
現在は普及しております

2017年7月8日土曜日

Nyafoo!のビジネスモデル

Nyafoo!を作るにあたり、課題は利益の上げ方でした。
安定してサービスを提供するためには、定期的な売り上げが必要です。

様々な企業のビジネスモデルを参考に、Nyafoo!は独自コンテンツでサブスクリプションを目指すことにしました。
プラットフォームはEntyを借りることにします。

こんな資金の流れを考えています。
・Nyafoo!でトラフィックを集める
・トラフィックで広告収入を得る
・広告の余剰資金でクリエイターにコンテンツの作成を依頼する
・Nyafoo!のヘビーユーザーにサブスクリプションを呼びかける
・サブスクリプションしてくれた人に、クローズドなコンテンツを提供する
・サブスクリプションで生まれた余剰資金で、さらにクローズドなコンテンツを作成

独自コンテンツは、まだ契約が完了していないので詳しく語ることができません。
こちらも、考えながら走り続ける感じになりそうです。

クリエイターの生活は厳しいです。
特にデジタルイラストレーターは、ソーシャルゲームで買い叩かれて大変です。
クリエイターとNyafoo!で、きちんと資金を回せることを目指して頑張ります。

2017年7月7日金曜日

Nyafoo!の掲載基準

こんばんは。nyafooです。
今日はNyafoo!の掲載基準の考え方についてお話します。

まず、Nyafoo!はホワイトリスト方式の検索エンジンです。
登録したURLが検索対象になります。
発想は新しくありません。
むしろ、最古の検索エンジンの復刻版とも言えるものです。

Nyafoo!の掲載基準を考えるにあたり、「ネットらしくない」方針を取ることにしました。
具体的には、業界団体や国の許認可、株式の上場の有無など、既存の価値観にのっとって巡回先を決めています。

例えば、「新聞」カテゴリの巡回先は、原則として日本新聞協会の加盟紙を選んでいます。
まったくネットらしくありません。

これは、「ネットらしい」やりかたでは、GoogleやAmazon、Facebookのような巨大資本に勝ち目がないと考えたからです。
彼らと違う発想でサービスを組み立てたら、今までと違う価値観のモノが生み出せるのではないかと考えています。

逆に、Nyafoo!の技術的基盤は、まったく「ネットらしい」作りになっています。
基盤のFess、elasticsearch、Linuxはオープンソースですし、実行環境はAWSです。
基盤をネットらしくすることで、サービスの構築コストや運用コストを下げ、見捨てられた方法にも活路が見いだせるのではないでしょうか。

Nyafoo!が脚光を浴びたのと同時期に、Yahoo! JAPANがディレクトリ検索の閉鎖を発表しました。

残り物には福があると言いますし、温故知新でどこまで行けるか、頑張ってみたいと思います。

2017年7月6日木曜日

はじめまして。nyafooです。

こんにちは、nyafooです。カタカナの呼び名はありません。
急に注目されてびっくりしています。
サービスはNyafoo!、僕はnyafooです。

Twitterでは書ききれないことを書いてゆきたいと思います。

まず、Nyafoo!の基盤はFessです。
Fessの完成度は素晴らしく、インストールしてすぐに使うことができます。
拡張性も優れており、外部のelasticsearchクラスタを使えば、相当なスケールまで対応できるはずです。

elasticsearchは凄いですね。クラスタの処理能力が不足してきたら、新しくノードを追加するだけで、勝手にインデックスや負荷を分散してくれます。

Nyafoo!はAWSを使っています。ロケーションはオレゴンです。理由は安い割に日本からのレスポンスが良かったからです。

リバースプロキシにnginxを使い、キャッシュを有効にしています。

ここまで、すべてオープンソースのプロダクトでできています。本当に先人たちの好意に感謝です。

ブログはじめます

テスト投稿です

はじめてのクラスタ破損

朝、目覚めのコーヒーを入れ、iPadでFessの管理画面に入ると。 帯が赤い。 クラスタ破損です。 一気に目が覚めました。 ざっとインデックスを眺めると、Fess.2017xxxxは正常。 .crawlerも正常。 .suggest関連がいくつか破損したようです。 ...