日本語のテキスト分析にNVIDIA DGX-1は不可欠な存在

デエイアイグノシス株式会社 様

デエイアイグノシスの代表取締役である大松重尚氏は、 最近ひと際注目を集めているAI(人工知能)を活用した、 日本語でのテキスト分析の実用化を目指している。 この分析では、機械学習やディープラーニング(深層学習)などを 駆使するため、膨大かつ複雑なデータ処理をこなす必要がある。 その作業に不可欠な存在となっているのが「NVIDIA DGX-1」だ。

main-1

 デエイアイグノシスは現在、AIによる言語系文字分析を実現し、さまざまな分野への展開を進めている。例えばCRM分野では、ネットショップや通信販売のコールセンターにおける対話のテキストデータを分析し、顧客プロフィールをリアルタイムに解析。そこから最適な対応を導き出すことでオペレーター業務のサポートを可能にするシステムを開発している。医療分野では、電子カルテなどのさまざまなテキスト情報をディープラーニングで分析し、それをベースとした診断支援を実現するシステムのコアとなるエンジンを開発中である。

 これらのサービスにおいて、情報の精度を高めるためにはより多くのデータを処理する必要がある。その一方で、データが豊富に存在しても、データの処理を最適化するまでの時間がかかり過ぎていてはビジネスとして成り立たない。

 「結果の積み重ねが、AIの進化に重要なことは言うまでもないことだ。さらに、それに要する時間をどれだけ短くすることができるか。これも無視することのできない大切なポイントとなる。だからこそ、GPUで膨大な計算を高速に処理できるNVIDIADGX-1は、AIを使ったサービスに欠かすことのできない存在といえる」(大松氏)。

Tesla P100を8基搭載したNVIDIA DGX-1

Tesla P100を8基搭載したNVIDIA DGX-1

デエイアイグノシス 代表取締役 大松重尚 氏

デエイアイグノシス 代表取締役 大松重尚 氏

 

 

 

 

 

GoogleとNVIDIAの動きからGPUの可能性を感じ取った

 大松氏がGPUコンピューティングに関心も持ったきっかけは、2016年に開催された「GoogleCloudPlatformGlobalUserConference」にある。そこで発表された内容や元CEOのエリック・シュミット氏の講演から、「GoogleはいまGPUに注目している」と啓発されたそうだ。さらに同年、NVIDIAがカリフォルニア州サンノゼで開催したイベント「GPUTechnologyConference(GTC)」に参加したところ、CEOのジェン・スン・フアン氏が具体的な事例とともにディープラーニング向けの自社製GPUワークステーションを発表した。

 このGoogleとNVIDIAの動きに、大松氏はGPUコンピューティングの可能性をいち早く感じ取ったという。そして、GTCの会場で即座にこのGPUワークステーションの購入を申し込んだ。とはいえ、初期モデルは何かと技術的な要求や課題が多い時期にあるため、自力での対応に苦労を重ねたこともあったとのこと。しかし、大松氏は「それが経験となって後々に生きてくる」と語り、他社よりも先んじて先進的な取り組みに対応することの重要性を指摘する。

 実際、大松氏は現在のようにAIに注目が集まる前からGPUをベースとしたコンピューティングに携わってきたことで、豊富な知識とノウハウを身につけてきた。そのため、ハードウェアの準備やベースとなる部分のセッティングはベンダーに任せるものの、システム構築のほとんどを自社でこなすまでに至っている。
デエイアイグノシスのロゴマーク。AIを強く意識していることがうかがえる

デエイアイグノシスのロゴマーク。AIを強く意識していることがうかがえる

 そのレベルの高さは、NVIDIADGX-1の提供元であるNVIDIAの山田泰永氏も一目置くほどだ。「近年はAIのビジネス利用が広まったことで、ディープラーニング向けを標榜するサーバーが数多く登場しているものの、それを自分の手足のように扱える人材はそれほど多くない。そんななか、デエイアイグノシスさんは高性能かつ運用管理が容易なNVIDIA純正のアプライアンスであるNVIDIADGX-1にいち早く着目して導入。しかも、外部に頼ることなく独自に研究開発を続けている点は『さすが』と言う他はない」(山田氏)。

 

 

テキスト分析に利用される機械学習は特別な技術ではない

 デエイアイグノシスが現在研究しているテキスト分析では、「Word2vec」と呼ばれる手法等を用いている。これはテキストをディープラーニングで理解できるように数値形式へ変換するもので、テキストを特徴量ベクトルに置き換える。これに「教師あり学習」「教師なし学習」「強化学習」「ディープラーニング」といった機械学習を組み合わせ、分析精度を高める努力を日々進めているわけだ。

 「そもそも、機械学習は今に始まった特別な技術ではない。個々の性能は低くても、数多くのマシンで同様の学習を継続的に実行し、どれか1つでもブレイクスルーできれば、他がそれを真似してさらなる進化することができるというのが仕組みだ。

 例えば、これまでは作ったアルゴリズムをすぐに現場へ導入し、専門家が何度もやり取りを重ねて完成品にまでブラッシュアップしてきた。しかし機械学習を活用すれば、これを機械だけで自動かつ短時間に完了できるようになる。漫画の忍者のように、何百人にも分身して一斉に高速で修行すれば、短時間で飛躍的に強くなれるというイメージに近い」(大松氏)

 ただし大松氏は、「日本語は英語に比べると、格段にテキスト分析が難しい」という。なぜなら、日本語は句読点に加えてカタカナや英語なども混在する独特な文字形式となるため、ノイズとなる要素が非常に多いからだ。しかし、このようなノイズへの対処はほぼ完了しつつあり、自動化のメドも立っているとのこと。このように、「単語の分類」からさらに一歩進んだ「文脈の理解」を実現するための研究が、既に始まっている。

 

やりたいことを最短で実現できる最強のワークステーション

 日々進化を続けているデエイアイグノシスのテキスト分析は、現在コールセンターや医療診断支援の分野への活用が期待される。概念的には、コールセンターのやり取りや患者のカルテなどから対話テキストを取り出し、そこに意味や価値を持たせているイメージだ。「今後は、これに時間で変化する途中経過の情報なども追加できれば、時系列を先取りした予測なども可能となるだろう」(大松氏)。

 このようにデータ量が増えていけば、それだけ情報の裏付けも取りやすくなるため価値は上がっていく。その一方で、機械学習の負荷はより一層増すことになるだろう。そのため、仮に価値が上がったとしても、そのための計算時間が数か月もかかるようでは問題だ。その点、NVIDIADGX-1のような高性能ワークステーションがあれば心配はいらない。大松氏も「NVIDIADGX-1ならプログラム次第で大規模な計算でも数時間、簡単なものなら数分で終わる」と太鼓判を押す。さらに「次のことをどんどん進めていかないと可能性は広がらない。いま進んでいる方向が間違っている可能性もあるため、スピード感は重要だ」とその必要性を後押しする。

 そのほか、NVIDIADGX-1はハードウェアやOSに加えて、仮想環境のNV-Dockerや「TensorFlow」「Caffe」「CNTK」「Theano」「MXNet」といったディープラーニング関連のフレームワークを動作確認済みで用意する。トータルコーディネートされた形で提供されるため、運用面でのメリットは大きい。また、デエイアイグノシスでは仮想環境での複数ジョブ管理において「コンテナごとに利用するGPUを手動で指定している」(大松氏)のだが、NVIDIAの山崎和博氏は「例えば、ApacheMesosは複数GPUのジョブ管理に対応している」と助言し、さらなる効率的な運用をサポートする。

 とはいえ、オンプレミスで高性能なGPUワークステーションを持つことは容易ではない。そのため、Googleなどのクラウドサービスを活用してやる方が「当座のメリットは高い」という考え方もあるだろう。しかし、大松氏の考えは違う。

 「計算のプロセスと結果だけが早くわかっても、それは我々の開発思想にフィットしない。処理工程の中身をしっかり把握して理解することが重要であり、それが次のプログラミング開発に生かせるからだ。その上で、クラウドサービスともやり取りが容易になる。そういった意味でも、GPUワークステーションは重要な存在だと認識している。総合的に見て、我々のやりたいことを最短で実現してくれる最強のワークステーションはNVIDIADGX-1に他ならない」(大松氏)

NVIDIA エンタープライズ事業部 マネージャー メディカル・ライフサイエンスビジネス責任者兼スタートアップ・技術パートナー支援担当 山田泰永 氏

NVIDIA エンタープライズ事業部 マネージャー メディカル・ライフサイエンスビジネス責任者兼スタートアップ・技術パートナー支援担当 山田泰永 氏

NVIDIA ディープラーニング ソリューション アーキテクト 山崎和博 氏

NVIDIA ディープラーニング ソリューション アーキテクト 山崎和博 氏

デエイアイグノシスの使用モデル

377_img06

NVIDIA DGX-1

NVIDIA自社設計のNVLink対応マザーボードに、最新アーキテクチャVOLTA世代のGPU「TESLA V100」を8基搭載したディープラーニング専用スーパーコンピュータ。40,960のCUDAコアを実装し、単精度で960TFLOPSの演算性能を実現する。

TOPへ