コロナ禍によってオンライン会議が主流となり、直接会わなくても打ち合わせや商談が可能となりました。直接会わないぶん、親睦を深めるようなコミュニケーションは取りづらくなりましたが、逆にこれまで出張しなければ実現しなかった海外との商談がやりやすくなっています。

とはいえ、商談するには当然日本語ではダメ。相手の言語に合わせて話さなければならず、言葉の壁の高さに商談を諦めていた企業も少なくないでしょう。

そんなご時世に登場したのが「ポケトーク字幕」です。もともと、AI通訳機として販売していた「ポケトーク」の技術を活用し、オンライン会議においてすぐに翻訳し字幕として表示するという優れもの。ポケトークで培った精度の高さと翻訳の速さとが売りで、注目を集めています。

今回は、ポケトーク株式会社の取締役 兼 CMOの若山幹晴さんにお話を伺いました。

エンジニアでありタレントの池澤あやかさん。なお記事中の発言は個人の見解で所属企業を代表するものではありません

エンジニアでありタレントの池澤あやかさん。なお記事中の発言は個人の見解で所属企業を代表するものではありません

ポケトークが速くて精度が高い秘密とは

ポケトーク株式会社 取締役 兼 CMOの若山幹晴さん

ポケトーク株式会社 取締役 兼 CMOの若山幹晴さん

若山幹晴さん(以下、若山) 「早速ですが、ポケトークはご存じですか?」

池澤あやかさん(以下、池澤) 「どんなものかは知っていますが、実際に使ったことはありません」

若山 「ポケトークは、もともとソースネクスト株式会社というソフトウェアやIoT製品を販売している会社で販売をしていたのですが、2022年2月にポケトーク事業を分社化し、ポケトーク株式会社として事業をさらに進めていく体制になりました。

ポケトークは “夢のAI通訳機”と銘打っている通訳・翻訳機です。翻訳の精度が高くスピードが速いこと。そしてボタンを押している間に話した内容を翻訳し、発声してくれるという使いやすいシンプルなUIのため直感的に使えるのが特徴です」

池澤 「普通に話しても精度が高く、反応も速いですね」

若山 「話し終わったあと、すぐに翻訳結果が出てくるという速度感と、私が話す速度もゆっくりではなく普通に話すぐらいの速度でも、しっかり翻訳してくれることがわかると思います。日常会話だけでなくちょっと難しいニュース原稿でもキチンと訳してくれます。ビジネス会話を含めて精度が高く、瞬時に翻訳できるのが特徴です。

操作も簡単で、初期設定は日本語と英語という形になっているのですが、音声で例えば『フランス語』というだけでフランス語が選べるので、かなり直感的になっています」

ニュース原稿を読んだときも、キチンと日本語を認識しています

ニュース原稿を読んだときも、キチンと日本語を認識しています

それを瞬時に翻訳して、発声してくれます。ネイティブの人が発音しているように発声してくれるため、違和感がありません

それを瞬時に翻訳して、発声してくれます。ネイティブの人が発音しているように発声してくれるため、違和感がありません

池澤 「どのような人が購入されているのでしょう?」

若山 「ポケトークは2017年から販売していますが、法人さまだけでなくスマホに慣れていない高齢の方が、箱から取り出してそのまま使えるため、かなり好評をいただいております」

池澤 「なぜ、これほど翻訳精度が高くスピードも速いのでしょう」

若山 「実は3つのエンジンを利用しています。1つ目は、話した音声をテキスト化する音声認識エンジンです。次に、そのテキストを翻訳するエンジン。最後に、その翻訳した文章を音声として発声する音声発話エンジンです。エンジン自体はすべてクラウド上にあり、インターネットを介して実行しています。

それぞれでかなり技術革新があり、例えば音声からテキストへのエンジンでは、以前はゆっくり話さなければ認識できなかったところから、クラウド上での機械学習(AI)により精度がすごく高まっています。翻訳や発話に関しても、どんどん精度が上がっています。

われわれの強みは、言語ごとにいちばん精度のいいものを抽出し、AIで選びながらエンジンを切り替えているところです」

言語によって、最適なエンジンの組み合わせで処理をしています

言語によって、最適なエンジンの組み合わせで処理をしています

池澤 「それぞれ1つにエンジンを絞らず、言語によって変えているんですね」

若山 「世界中にさまざまなエンジンがあり、エンジンごとに得手不得手な言語があります。例えばアメリカ企業なら、英語の精度は高いのですが、日本語の音声は国産のほうがよかったりと、言語によってエンジンの組み合わせを考えているところが強みです。

また音声の速さと精度ですが、プッシュ&トーク形式なので話した瞬間にエンジンが回り、ボタンを離したら即翻訳完了して発声する速さを実現しています。このあたりの技術は特許を取得しています」

ポケトークは2017年から販売開始。現在ポケトークWとカメラ翻訳つきの「ポケトークS」、画面サイズを大きくした「ポケトークS Plus」が販売されています

ポケトークは2017年から販売開始。現在ポケトークWとカメラ翻訳つきの「ポケトークS」、画面サイズを大きくした「ポケトークS Plus」が販売されています

池澤 「さまざまなエンジンの中から最適なものを選択しているとのことですが、絶えず最新エンジンをチェックして、随時切り替えたりしているのですか?」

若山 「言語によってエンジンの数が違うので、それぞれ頻度は違いますが、エンジン自体は日々進化しており、常に最新の技術に変えていくということは、精度アップにもつながるためエンジンの選択は重要な要素となっています。また技術革新とともに対応言語数も増えているので、世界中の技術を見ていきながら、言語数も増やしているところです」

池澤 「ということは日々、こっちが良くなってきたな、となったらそちらに切り替えたりするんですね」

若山 「まさにそうなんです。テキスト化と翻訳、発声の3つエンジンがあり、それぞれ82言語あるので、ものすごい組み合わせになるんです。日本語から英語、英語から日本語でエンジンが違うということもあります」

ポケトーク字幕で海外の方とのオンライン会議でも通訳いらず

若山 「ここまで、単体製品を中心に販売してきましたが、2022年1月に販売を開始したのが、ポケトーク字幕です」

池澤 「喋った言葉が翻訳されて字幕として表示されるというものですか?」

若山 「簡単にいうと、そのとおりです。ポケトーク自体は、法人さまはもちろん、個人消費者の方にまで幅広く使われていたのですが、コロナ禍により、対面でのコミュニケーションが激減してしまいました。

われわれは、これまで通訳機を売るという感覚でいたのですが、もともとは言葉の壁をなくすソリューションを目指していたことを思い出しまして。コロナ禍で生活様式が激変したときに、ほかにどんな言葉の壁があるのかを鑑み、オンライン会議に着目しました。

海外の方とのやりとりの際、通訳さんを毎回入れるのは難しく、オンライン会議上で言葉の壁をなくすサービスを考えたところ、ポケトーク字幕が生まれました」

池澤 「会議で英語が飛び交うと、訳してくれると助かると感じることがあります」

若山 「ポケトーク字幕は、ポケトークをパソコン内に入れたようなイメージで、ボタンをクリックしながら話すことで、翻訳された文字が自分の映像に字幕として映ります。実は似たようなサービスがいくつかあるのですが、字幕が出るまでの速度が他のサービスに比べ最大3.2倍ぐらい速いのが売りです。また翻訳精度はポケトークと同等で、クラウド上の最新のエンジンを常に選びながら精度高い翻訳を行っています。

さらに現在82言語に対応しており、最大2言語を同時に翻訳して字幕表示することが可能です」

池澤 「確かに字幕がストレスにならないタイミングで表示されますね。2か国語同時翻訳というのもスゴイ! 」

若山 「通訳を使ったら大変なことになりますし、このポケトーク字幕によって3か国語でのコミュニケーションが可能になります」

池澤 「これは、オンライン会議のシステムは選ばないのですか?」

若山 「Webカメラで撮影する映像に直接字幕を合成させているため、オンライン会議のシステムに依存しません。ZoomでもTeamsでも、Webexでも大丈夫です。われわれとしては、会議での利用を想定していたのですが、例えばYouTubeなどで配信するときや、セミナー形式での利用でも活用できます。

テスト版を2021年9月に公開したところ、やっぱり速度と精度に関しては本当に驚かれる声が多かったですね。今まで海外の取引先との商談をためらっていた方や、海外展開するには言葉の壁があるから難しいという方が、ポケトーク字幕によってビジネスの可能性を広げられたと、お客さまから好評いただいております」

まだまだ続く「言葉の壁をなくす」取り組み

池澤 「日本だけでなく世界でもビジネスをされていますが、どこがいまホットですか?」

若山 「実は日本と海外の売上でいきますと、海外のほうが多くなってきています。特にアメリカは移民国家のため、約20%の方が英語を話せない状況なのです。そのため、医療機関や学校、もちろん法人も含めて需要が拡大しています。

ポケトーク字幕に関しても、コロナ禍により医療で使われるケースが増えています。日本以上にアメリカではリモート診療が発達しており、言語の違う患者さんに対してスムーズにコミュニケーションができるようになったといいます」

池澤 「アメリカで広がっているというのは意外です」

若山 「実は日本ほど誰もが母国語を話せる国は少ないため、ダイバーシティーのある国にとっては、言語の壁があるのだと考えられます。また、実は商談以外にも多国籍化している企業が増えていますので、社内コミュニケーションでも使われているケースが多く、ポケトーク字幕によって言葉の壁が取り払われれば法人さまの可能性が広がり、より社会が豊かになっていければと思っています」

池澤 「新しいプロダクトを立て続けにリリースされていますが、今後はどういった展開を考えていますか?」

若山 「まだまだ言葉の壁があって、こういったシーンで困るという所で活用できるサービスを展開していきたいと考えています。まだ検討段階ではありますが、ウェアラブルなIoT端末に進化していくのではないかと思っていて、われわれはハードウェアからソフトウェア、アプリまで販売できますので、言葉の壁があるところにどんどん提供していきたいと思っています」

池澤 「言葉の壁をなくすために、教育分野に貢献するという考えもあると思います」

若山 「実は、このポケトーク字幕の中にはAI会話レッスンが、英語と中国語で入っています。発音した言葉がちゃんと言葉として捉えられているかチェックできるので、学習に活用されてもいます。ですので、英会話学校や小中学校も含めた教育機関との協業という形で貢献できるかなと思っています。

実はこのコロナ禍で端末のほうも、ほかにどういったシーンで使われるか見直したところ、日本に住まわれている外国籍の方のお子さんが、小中学校に通うときに保護者の方が先生との対話で活用できることがわかり、教育機関にも導入が進んでおります」

池澤 「確かに、みんながみんなインターナショナルスクールへ通うわけではないですしね」

若山 「医療機関で外国籍の方が診察を受ける際のコミュニケーションや、工場などでの社内コミュニケーションで、きちんと意思疎通しないと重大な事故が起こりかねません。そんなときにポケトークが活躍しますので、観光需要はもちろんですが、それ以外にも今後どんどん広がっていくことを期待しています」

ポケトーク字幕

AI通訳機「ポケトーク」と同じエンジンを使用。 世界82言語のテキスト翻訳ができ、言語ごとに最適なエンジンを使っています。話し終わってから翻訳結果の字幕が表示されるまでの時間が、他社ビデオ会議システムに搭載された翻訳機能より3.2倍以上速く、翻訳結果を、まるで映画の字幕のようにWebカメラの映像と合成し、海外とのリモート会議から言葉の壁をなくします。

サブスクリプション管理ポータルiKAZUCHI(雷)

「iKAZUCHI(雷)/いかづち」はサブスクリプション管理ポータルです。DISの販売パートナーは、「iKAZUCHI(雷)」をご利用いただくことで、多様化するサブスクリプション型のクラウドサービスの注文工数が削減され、月額や年額の継続型ストックビジネスの契約やご契約者様の一元管理が可能になります。