中国の生成AI「DeepSeek」は使ってはならない

 中国企業が開発した生成AI「ディープシーク(DeepSeek)」が驚異的な安価で開発され、かつ最上級モデルに匹敵する性能だというので既存企業の株価を一気に下げるなど、世界的に衝撃を与えている。米NVIDIAの株価が急落、1日でトヨタ自動車の2倍分の時価総額が吹き飛んだのだから、世界は驚いた。ところが絶頂感はひと時で今では、先達技術の”盗用”であるとか、中国共産党のスパイ機能が仕組まれているとか現在ではマイナスイメージの情報であふれかえっている。

そんななか、自民党の小野寺五典政調会長は31日の衆院予算委員会で、「ディープシークに、尖閣諸島(沖縄県石垣市)が日本の領土かと尋ねたところ、『中国固有の領土だ』と事実と違う答えが返ってきた」と指摘した。

一方、オープンAIが開発した「チャットGPT」の場合は、尖閣諸島が「日本の領土であるといえる」と回答したという。「当たり前のことをねじ曲げてしまうのがディープシークだ。既に認知戦が始まっていると考えるべきだ」と強調した。

時宜を得た指摘で、やっぱりそうか、とブログ子も試してみた。生成AIの優秀性には昨年初めから啓発され自分のホームページで使っているのだ。例えば、HPで毒キノコについて書いているのだが、「ハイイロシメジの毒性について科学的解説をしてほしい」と入れると、たちどころに数十行の説明が返ってくる。いままでGoogleであちこち調べていたのが瞬時で出てくるのだからやめられない。

小野寺議員に倣って尖閣諸島の帰属について回答を求めたところ「不好意思,DeepSeek 搜索服务繁忙,请关闭联网搜索功能,或者过几分钟再试」と返ってきた。

「申し訳ございませんが、DeepSeek 検索サービスはビジー状態です。数分後にもう一度お試しください。」と言う拒否だ。早くも「学習」したらしく小野寺議員指摘のように「中国固有の領土」ではなく、繁忙理由の回答拒否である。

試しにブログ子が使っている他の生成AIでも試してみた。「ChatGPT 」では「尖閣諸島(センカクショトウ)は、現在日本が実効支配している領土です。ただし、中国と台湾も領有権を主張しており、これが外交的な争いを引き起こしています。日本では沖縄県に所属し、尖閣諸島はその一部とされています」と出た。

他に使っている「Genspark」「Felo」「Gemini」「Perplexity」、いずれも同じくきちんと日本領土という回答だった。使う側からすれば正確で、書かれている内容の情報源が明示されていればどれでもいい。しかし、DeepSeekは明らかに中国政府の意向に添った回答がプログラムされている。

DeepSeekを開発したのは梁文鋒という人物だ。1985年、広東省湛江市で生まれ、浙江大学で学部と修士課程でAIを学び、「AIは必ず世界を変える」という強い確信を抱くに至った。2008年、23歳になった梁文峰と彼のクラスメートは、マクロ経済データなどを蓄積するためのチームを結成し、2023年、梁文鋒は汎用人工知能を目指してディープシークを設立した。

つまり会社設立わずか1年で世界の株価を左右するような高度の生成AIを作り上げたことになる。優秀なAIモデルは一握りの欧米企業によって独占されている。それは最先端のAIモデルを開発するには、エヌビディアが提供しているような最先端のGPUを大量に用意し、多額のコストと時間をかけてAIのトレーニングを行う必要があるためだ。

その上に、アメリカは少し前から、中国の台頭を警戒してAI開発に必要な半導体や関連技術の輸出制限を行っている。そのため中国のAI開発者は事実上、欧米のトップAI企業が開発に使用しているような、高度なGPUや開発環境を十分に利用できない。

 莫大な投資と大量の最先端のGPUを必要とするこの開発を、ディープシークは、どのように手に入れたのか。

現在言われているのは、アメリカ企業が開発しているAIモデルを使ってAIを構築したのではないか、という疑いだ。具体的にはChatGPTや、メタ社の生成AI「Llama」(ラマ)の両方から回答方法プログラムをコピーするという方法、いわゆるAIの「アウトプット(出力=回答)泥棒」の可能性だ。

蒸留(Distillation)」という手法だ。蒸留というのは一般には耳慣れない言葉だが、簡単に言うと、既存のモデルを「教師」として、質問を投げかけてはその反応を「生徒」すなわち新たに開発したいモデルに学ばせるという手法だ。その過程を酒造になぞらえて「蒸留」と呼んでいるのである。(右図はそのイメージ=読売新聞から)

世界中で入力されたデータはDeepSeekに蓄積されるわけだが、中国では企業が保有しているデータは中国政府が収集できるという悪名高い「国家情報法」がある。要するに、DeepSeekに入力した情報は中国政府に流れる可能性が高いのだ。

結論をいうと、DeepSeekは使ってはならない。と同時に大きく出遅れている日本は一刻も早く日本版の生成AIを独力で作り上げなければならない。

 

コメントは受け付けていません。