CocCoc, Another Big Vietnamese Search Engine is Here
On January 30th, CocCoc, a new Vietnamese search engine, arrived on the scene. It’s the second big homegrown Vietnamese search engine to appear in the past three months. And by big, I mean:
Well, including search raters and other staff, we have about 400 people. Five in marketing, four in accounting. You can safely assume that the rest is a technical team.
もう1つのベトナム大手の検索エンジン「CocCoc」
1月31日、ベトナムの検索エンジン業界に新しいサービスCocCocが登場した。CocCocは、ここ3か月間に登場した2つめの大きな国内開発の検索エンジンだ。その大きいという意味は、つまり次の通り。
「検索評価をする人やその他のスタッフを含め、当社には約400人の社員がいます。マーケティング担当が5人、会計担当が4人、残りのスタッフは技術チームと言ってもいいでしょう。」
That’s Victor Lavrenko, CEO at CocCoc. The project, which started two years ago, has been in closed development until very recently. Since inception, the project has burned over US$15 million, with most of the 400 person staff working full time. The new search engine looks to take on the incumbent Google.com.vn and the competitor that came out last November.
と語るのは、CocCoc最高経営責任者のVictor Lavrenko氏。同プロジェクトが開始されたのは2年前だが、ごく最近まで非公開の開発段階にあった。プロジェクト開始当初からの資金投入額は1500万米ドルを超え、スタッフ400人のほとんどが正社員として働いている。この新しい検索エンジンは、Google.com.vnと昨年11月にローンチされた競合サービスと対抗することを目指している。
Russian roubles
Victor is from Russia. So are another 40 engineers in the team. These engineers have had experience battling Google back home in Russia, getting up to even 20 to 25 percent of the search queries in Russia through native search engine, Nigma. So they felt confident enough to fully enter the Vietnamese market. The company is mainly funded by Russian venture capitalists like Digital Sky Technologies, who also invested in Facebook early on.
Edit: Nigma did not secure 20 to 25 percent of the market but decided to move its energies to Vietnam.
CocCoc is actually a spin-off from projects back home, Victor explains to TechinAsia:
ロシアからの資金注入
Lavrenko氏はロシアの出身で、同チームのエンジニア40人もロシア出身だ。この40人のエンジニアは故郷のロシアでGoogleと競い合った経験を持っていて、(Nigmaというロシアの検索エンジンを通じて、ロシア国内の検索市場の最大20〜25%のシェア率さえも確保した)。だから、ベトナム市場への完全参入には十分な自信を感じていた。同社は主に、ロシアのベンキャーキャピタリストからの支援を受けている。そのなかには、以前にFacebookにも出資をしているDigital Sky Technologies社も含まれている。
編集:Nigmaは市場のシェア率20〜25% を確保しなかったが、ベトナム市場への参入に同社のエネルギーを向けることに決めた。
CocCocは実はロシアで展開していたプロジェクトのスピンオフサービスだ、とLavrenko氏はTechinAsiaに説明している。
It comes from an experimental search engine in Russia, nigma.ru. It gave us good experience and a good team. Second, we’re not just a startup with an idea or a weak prototype. We already have the engine and many experts, including current and former Google employees, and are quite enthusiastic about our search quality.
「CocCocはnigma.ruというロシアでの実験的な検索エンジンがもとになっています。このプロジェクトから、よい経験とよいチームを手に入れることができました。そして、私達は、アイデアもしくは脆弱なプロトタイプを持っているだけという単なるスタートアップではなりません。当社にはすでに、この検索エンジンがありますし、Googleの現社員および元社員を含む多くの専門家がいます。そして、当社が提供する検索機能の質の良さについても、かなりの自信があります。」
For example, the top Vietnamese guy at Google, Christopher Nguyen, thinks that in 92 percent of the navigational queries – when you search for a particular website – we’re the same or better than Google. Also, we have lots of very experienced individuals. About 10 people are from the leading Russian search engine Yandex that beat Google 3:1 by market share in Russia. The head of our web search team is the guy who created the first Russian search engine.
「例えば、Googleベトナムの責任者を務めるベトナム人のChristopher Nguyen氏は、ある特定のウェブサイトを検索する場合、検索結果の92%を比較すると、CocCocはGoogleと同程度、もしくはそれ以上のよい結果を出すと考えています。また、当社には非常に経験豊かなスタッフが大勢います。ロシアの市場シェア率において、3:1という割合でGoogleを打ち負かしたロシアの大手検索エンジンYandexから、約10人ほどのスタッフがCocCocに来ています。当社のウェブサーチチームの責任者はロシアで最初に検索エンジンを開発した人です。
It was later killed by an ISP that bought it out, so he did it for a second time with Mail.ru, and now it has about 10 percent market share – it’s not much, but quite comparable to Google’s 20 percent. And he had only $700,000, so the project was underfinanced, but he still got quite good results. I myself was a co-founder of Mail.ru, as a CTO, which is now a $7 billion company traded on the London Stock Exchange.
その最初の検索エンジンは後に、買収されたインタネットサービスプロバイダーによって潰されてしまったので、その開発者はMail.ruで2度目の開発をし、今では市場シェア率の約10%を獲得しています。この数字はそれほど大きくはありませんが、Googleの20%と比較できる数字です。また、彼はわずか70万ドルしか持っていなかったので、同プロジェクトへの資金が不足していたにもかかわらず、彼はかなり良い結果を得ました。私自身はMail.ruのCTOで共同設立者でしたが、同社は今では時価総額が70億ドルにも上る、ロンドン証券取引所の上場企業となっています。」
Other Russian roots can also be seen in the afore-mentioned other newcomer, Wada, which launched in November last year, and which is built on search technology from Ashmanov and Partners.
Search me for a reason why Russians are getting involved in Vietnamese search engines.
The Mechanics of CocCoc
CocCoc means “Knock Knock” in Vietnamese and signifies the team’s sensitivity to the Vietnamese language. Victor stresses that his new search engine “better understand Vietnamese linguistics, and rarely produce irrelevant results …. At least that’s our goal.”
さらに、前述した昨年11月にローンチされた新しいサービスWadaにもロシアをルーツにするものがある。同サービスは、Ashmonov & Partnersが開発した検索テクノロジーをもとに構築されている。
どうしてロシア人がベトナムの検索エンジンサービスに関わっているのかは私にも分からない。
CocCocの仕組み
CocCocはベトナム語で「ノック、ノック」と言う意味で、同チームがベトナム語に敏感なことを示している。Lavrenko氏は、この新しい検索エンジンはベトナム語を「よりよく理解し、無関係な検索結果を表示することがめったにない ——少なくとも、それが私達の目標ですが——」と強調している。
For the nerdy folks out there, I had to ask Victor what specifically makes CocCoc better than Google’s search mechanics. According to Victor, since Google crawlers are outside Vietnam, its links are weak. CocCoc has two billion pages indexed so far in-country, he claims, so its numbers are more up to date. But the Vietnamese language is the trickiest area, and it has proven to be a hard nut for Google to crack. Victor explains the linguistic minefield:
パソコンおたくの人のために、CocCocがGoogleの検索メカニズムと比べて具体的に何が優れているのかをLavrenko氏に聞いてみた。同氏は、Googleの追従者はベトナム以外にいるので、リンクが弱いと言う。CocCocには国内でこれまでにインデックスをつけたページが20億ページあるので、同サービスのその数はGoogleよりも最新であるととLavrenko氏は語る。だが、ベトナム語というのが最も厄介な要素で、それがGoogleにとって厄介な問題であることが既に証明されている。同氏はベトナム語の難しい点について次のように説明している。
Well, it’s easy to explain the specifics using our name as an example. You may notice that it has a space within the word Ed: Though not when we type it! because Vietnamese words are written by syllables. They used Chinese characters before, and the principle is one Chinese character for one syllable. So usually words consist of two or more syllables. Even if a word is a one-syllable term, there is a so called “pairness tendency” in Vietnamese language – they will add a stop word or the syllable with the same meaning just to avoid telling the single syllable.
「例として、私達の名前を使って具体的に説明するのが簡単だと思います。『Ed』という言葉の間にはスペースがあることに気付くと思います。といっても、この言葉をタイプ入力するときにはないのですが!これは、ベトナム語が音節によって書かれているからです。ベトナムでは以前は中国語の文字が使われていました。原則的には、1つの中国語文字に1つの音節が用いられています。ですから、通常、言葉は2つ以上の音節から構成されています。1つの音節しかない言葉でも、ベトナム語には『ペアをつくる傾向』があります。すなわち、単一音節であると告げるのを避けるためだけに、ストップワードや同じ意味を持つ音節を加えるのです。」
Another specific is diacritics. There are two dimensions of diacritics in Vietnamese. The first dimension – is a pronunciation type – e.g. “o” can be just “o” or ”ô” or ”ơ”. The second dimension is tones. It can be “o” or ”ó” or ”ỏ” or ”ò” or ”õ” or ”ọ”. So altogether we have 18 combinations for all the Vietnamese vowels.
もう1つの具体例は区別的発音符です。これには2つの要素があります。1つめは発音です。例えば、「o」には「o」もしくは「ô」あるいは「ơ」という発音があります。2つめは声調です。「o」には「o」「 ó」「ỏ」「ò」「õ」「ọ」の声調があるので、これらすべてを組み合せると「o」には18通りの言い方があります。