How machine learning will fuel huge innovation over the next 5 years
Machine learning is coming into a golden age, and with it we’re seeing an awakening of possibilities formerly reserved for science fiction.
Machine learning (ML) is a computer’s way of learning from examples, and it’s one of the most useful tools we have for the construction of artificial intelligence (AI). It begins with the design of an algorithm that learns from collected data, creating machines that in most cases become smarter as data volumes intensify.
今後5年間に、どのように機械学習が大きなイノベーションを加速するか
機械学習は黄金時代に入りつつあり、それにより、かつてはSFの世界の話であったようなことが、実現しつつある。
機械学習(ML)は、コンピューターが実例をもとに学習する方法で、人工知能(AI)を構築する上で最も有用なツールの一つである。収集されたデータから学習するアルゴリズムの設計に始まり、多くの場合、データ量が増えるに従いより賢くなる機械ができあがる。
We’ve seen a breakthrough in the field of ML in the last five years in part due to the recent wealth of big data streams provided from high-speed internet, cloud computing, and widespread smartphone usage, leading to the birth of the now popular “deep learning” algorithms. Heavily- used applications that have emerged with ML at their core include recommendation systems like those from Netflix and Amazon, face recognition technology as seen in Facebook, email spam filters like those from Google and Microsoft, and speech recognition systems such as Siri.
過去5年間にML分野で起きたブレークスルーは、少なくとも部分的には、高速インターネット、クラウドコンピューティング、そしてスマートフォンの普及による、最近のビッグデータの流通のおかげであり、現在注目を集めている「深層学習」アルゴリズムの誕生につながった。MLの根本的な部分から派生した、非常によく使われている応用のなかには、NetflixやAmazonのおすすめシステム、Facebookにみられる顔認識技術、GoogleやMicrosoftなどによるEメール用スパムフィルター、そしてSiriなどの音声認識システムがある。
While the depth of advancement is unknown, what we can say with high certainty is that development in this field in the past five years will be nothing compared to what we’re going to see in the five years to come. Based on machine learning’s current state, here are four predictions of what we could see in the near future:
どれくらい進歩するかは分からないが、確実に言えることは、この分野における過去5年間の成果は、これからの5年間に私たちが見るであろう進歩とは比べものにならないということである。機械学習の現状をふまえて、近い将来実現するかもしれない4つの予想を示そう:
Image-Based Recognition: The technology for image and video-based recognition is on the horizon, and with it a whole new experience for users. Thanks to deep learning, we are now at the dawn of computers recognizing images, and the people and actions within them, with high accuracy based on the image alone and with minimum reliance on external data. It’s not just new pictures that will become recognizable either, but the entire history of digitized images and video footage. This will massively change how these assets are located and shared online.
画像認識:この画像と動画に基づいた認識テクノロジーは実現化は目前で、ユーザにとって全く新しい体験となる。ディープラーニング(深層学習)のおかげで、我々は今、コンピューターが画像もしくは最小限の外部データのみで、画像や画像内の人々や行動を高い精度で認識するという新たな局面に立っている。さらに認識されるのは新しい写真のみではなく、デジタル化された画像や動画の履歴の一切が認識される。このテクノロジーによってこれら資産のオンライン上での保存や共有のあり方が大きく変わっていくだろう。
For example, YouTube might soon intelligently find content related to parts of a clip you watched and liked based only on the visual content of the video itself. The resulting efficiencies in both our work and personal time will be profound.
たとえば、もうすぐYoutubeは、動画のうち、あなたが観て好感を持った部分に関連するコンテンツを、その動画の視覚的情報のみから、知的に探し出してくるかもしれない。そうなることにより節約される、私たちの手間と時間は計りしれない。
Healthcare: Machine learning’s ability to analyze and store massive amounts of data should provide physicians with much-needed second opinions and lead to the detection and treatment of medical ailments on a mass scale. Packaged as smart, wearable computing devices, personal health monitors that detect various conditions as they arise should become widespread in the next five years, in a similar fashion to activity trackers like Fitbit. The advancements here could significantly accelerate our human desire to protect our own longevity and create major breakthroughs for the operations of the medical industry.
健康管理:膨大な量のデータを分析・蓄積できるという機械学習の能力は、医者にとってかなりの場合必要とされるセカンドオピニオンを提供し、また複数単位での病気の発見と治療に導く。また、活動量計「Fitbit」と同様、おしゃれで身に装着できるコンピューテイング デバイスとして打ち出された、自身の様々なコンディションを探知するパーソナル健康モニターが、今後五年で普及するだろう。これらの進歩は、人間の長生きしたいという欲求を著しく加速させ、医療産業運営を大きく前進させるであろう。
Travel & Communication: By 2020, real-time translation technology may be fully accessible. We’ll see everything from an app on your phone that instantly translates foreign signs and texts to phone conversations that are immediately converted to a listener’s native language, without speakers even knowing the difference. As globalization booms, the language lines will soon be crossed. Business, in particular, stands to benefit enormously from the advancement here, with tech giants such as Google and Microsoft already taking the necessary steps to build such tools, making the need for a premium multilingual workforce obsolete.
旅行とコミュニケーション: 2020年までには、リアルタイム翻訳技術が本当に身近になっているかもしれない。外国の標識や文章を即時に翻訳してくるスマホのアプリから、会話を聞いている人の母国語に即時翻訳してくれ、しかも話し手にはその違いがわからないような電話までが出てくるだろう。グローバル化が広がるとともに、言語の壁は近いうちに越えられるだろう。特にビジネス界はこの進歩による膨大な恩恵を受ける立場にある。GoogleやMicrosoftといった巨大テクノロジー企業はすでにそのようなツールを作るために必要な作業を行っており、高価なマルチリンガル労働者の必要性を過去のものにするだろう。
Advertising: Based on recent ML advancements, in just a few short years augmented reality technology should become the commonplace method for integrated branding. This will allow advertisers to seamlessly place products into existing content by properly identifying the depth, relative size, lighting, and shading of the product in comparison to the setting. This essentially makes any historical video property available for integration. The computer vision technology firm Mirriad has already been heralded (and won an Oscar) for its advancements in the field. Looking at online video, as companies continue to try and tap into hugely popular amateur content, this technology will revolutionize their capabilities.
広告:近年のML(機会学習)の発達により、わずか数年のうちには拡張現実(AR)技術が統合ブランド化にとってあたりまえの手法となるであろう。この手法では奥行き・相対的サイズ・照明・影を識別し、広告主がシームレスに既存のコンテンツに商品を入れ込むことができる。基本的にどのような歴史的ビデオでも、合体させることが可能だ。コンピューター・ビジョン・テクノロジー企業のMirriadではすでにこの分野の発展で称賛を受けている(オスカーも受賞)。オンライン動画を見ると、各企業が絶大な人気のアマチュア動画に入り込もうと努力を続けているが、この技術で可能性は革命的に広がる。
So while we have already seen enormous advancements in the fields above of late, a full-scale commercialization of machine learning technologies could be seen as soon as 2020. While I’ve only listed a few predictions above, almost all sectors of the economy stand to benefit enormously from the efficiencies of this new era of machine learning. We are already seeing a swell in consumer demand in experiences that require ML at their core, and the examples above only touch the surface of what is possible. If things continue on the trajectory we expect, the golden age of machine learning might very well make the next five years in technology the most exciting yet.
上述の分野における最近の絶大なる発達をすでに我々も目にしているが、機会学習技術の商業化が全貌を現すのは2020年頃ではないだろうか。先ほど私が挙げた予測はほんの数点であるが、この機会学習新時代の効率化によって経済的にほぼすべての分野が得る恩恵ははかりしれない。すでにコアの部分でMLを必要とする消費者需要は増大しており、先に述べた例はMLがもたらす可能性の氷山の一角にすぎないのだ。もし我々の期待通りに事が進めば、機会学習の黄金期により、技術分野におけるこれからの5年は最もエキサイティングなものとなるだろう。
Mehrdad Fatourechi is CTO of BroadbandTV Corp (BBTV), a media-technology company that builds tools to help content creators grow. He has an in-depth knowledge of digital signal processing, machine learning, and pattern recognition algorithms and has authored several journal and conference papers with the focus on pattern recognition, machine learning, and intelligent algorithms. He previously held positions in the tech/education industry including as a research associate and sessional lecturer at the University of British Columbia as well as being the co-chair of the IEEE Signal Processing Chapter in Vancouver.
Mehrdad Fatourechi氏は、コンテンツ制作に携わる人達の成長をサポートするツールを制作するメディア技術企業、BroadbandTV Corp (BBTV)のCTO(最高技術責任者)を務めている。彼は、デジタル信号処理、機械学習、パターン認識アルゴリズムに精通しており、パターン認識、機械学習、そして知的アルゴリズムに焦点を当てた幾つかのジャーナルや学会論文を執筆している。以前彼は、技術・教育分野に身を置き、研究員やブリティッシュコロンビア大学の非常勤講師を務めており、IEEE Signal Processingのバンクーバー支部の共同委員長の座にも就いていた。