Researchers just built a free, open-source version of Siri
Major tech companies like Apple and Microsoft have been able to provide millions of people with personal digital assistants on mobile devices, allowing people to do things like set alarms or get answers to questions simply by speaking. Now, other companies can implement their own versions, using new open-source software called Sirius — an allusion, of course, to Apple’s Siri.
Today researchers from the University of Michigan are giving presentations on Sirius at the International Conference on Architectural Support for Programming Languages and Operating Systems in Turkey. Meanwhile, Sirius also made an appearance on Product Hunt this morning.
フリーかつオープンソースバージョンのSiriが登場
Apple、Microsoft等大手IT企業が数百万人を対象に、携帯機器のパーソナルアシスタンス機能の提供を開始した。機器に向かって話しかけるだけで、アラームの設定や質問への回答を可能とする機能だ。Siriusと呼ばれるAppleのSiriを意識した新オープンソースソフトウェアを使用することで、他企業による独自バージョンの開発が可能になる。
今日、トルコで開催されているプログラム言語およびOS向けアーキテクチャサポートに関する国際会議で、ミシガン大学の開発者がプレゼンを実施する予定である。同時に、今朝よりSiriusはProduct Huntにも登場している。
“Sirius … implements the core functionalities of an IPA (intelligent personal assistant) such as speech recognition, image matching, natural language processing and a question-and-answer system,” the researchers wrote in a new academic paper documenting their work. The system accepts questions and commands from a mobile device, processes information on servers, and provides audible responses on the mobile device.
Some startups have been striving to develop their own smart assistants, but none has yet been able to challenge Apple, Google, or Microsoft. Perhaps following the arrival of Sirius, that could change.
「Siriusとは……音声認識、画像マッチング、自然言語処理および質疑応答システムなどのIPA(インテリジェントパーソナルアシスタント)の中心的機能を果たすものである」研究者達は、研究成果を記載した新たな学術論文でこのように述べた。このシステムは、モバイル端末から質問や命令を受け付け、サーバー上で情報を処理し、モバイル端末上に音声で返答する。
スタートアップ企業の中には、独自のスマートアシスタントの開発に躍起になっているところもあるが、まだApple やGoogle、 Microsoftに対抗できる企業はない。Siriusの登場を受けて、恐らくこうした状況は変化する可能性がある。
The researchers sought to assemble a “representative of production grade systems.” Indeed, the speech recognition component of Sirius incorporates deep learning, an increasingly trendy type of artificial intelligence that involves training deep neural networks on extensive amounts of data and then having them make inferences about new data based on what they already know.
In addition to documenting their personal digital assistant, the researchers also ran tests to determine the best types of server chips for handling a complex workload like Sirius.
研究者たちは「商用レベルシステムの代表」を集めようとした。実際、Siriusの音声認識コンポーネントには、人工知能の手法としてトレンドになってきているディープラーニング(深層学習)が組み込まれている。それは大量のデータを深いレベルのニューラルネットワークに学習させ、その知識に基づいて新しいデータについて推定させるものである。
研究者らはパーソナルデジタルアシスタントについて記載したが、それに加えて、Siriusのような複雑な負荷を扱うのに最適なサーバーチップはどれかを決めるテストも行った。
“We show that GPU- and FPGA-accelerated servers can improve the query latency on average by 10x and 16x,” they wrote. “Leveraging the latency reduction, GPU- and FPGA-accelerated servers can reduce the TCO [total cost of ownership] by 2.6x and 1.4x, respectively.”
Read the full academic paper (PDF) to learn more about Sirius. Find Sirius on GitHub here.
And here’s a video of University of Michigan doctoral student Johann Hauswald demonstrating Sirius in a command-line interface:
「本稿では、GPUおよびFPGAを搭載したサーバーは、要求に対する平均待ち時間を10倍および16倍改善できることを示している」と論文には記載されている。「待ち時間の減少により、GPUおよびFPGAを搭載したサーバーはTCO(総所有コスト)をそれぞれ2.6倍および1.4倍減らすことができる」
Siriusについてさらに詳しく知りたい方は、学術論文(PDF)の全文を読んでほしい。GitHubでのSiriusについては、こちらからアクセスできる。
また、ミシガン大学博士課程のJohann Hauswald氏による、コマンドライン・インタフェースでのSiriusのデモンストレーションビデオはこちら。