なお、デベロッパーベータはNDA下にあり通常は試用した感想を公開することはできないが、ここでは特別な許可を得てレポートする。試用しているiOS 18.4デベロッパーベータは開発中のソフトウエアであり、一般公開されるものとは仕様が違う可能性がある。デベロッパーベータは未知の不具合がある可能性があり、フリーズしたりデータが消えたりする可能性が高い。一般の方の試用はお勧めしない。
この4月初旬、ようやく日本語版Apple Intelligenceローンチ!
アップルはiPhone 16eを含む、この1年に発売された全iPhone/Mac/iPadをApple Intelligence対応機種にするなど、Apple Intelligence対応に非常に重きを置いている。
ハードウェア的には、A17 Proチップ、または、A18、A18 Proチップ、もしくはMシリーズチップ搭載機が対応機種だ。つまり、一昨年発売されたiPhone 15 Proと、iPhone 16全シリーズ、iPad mini(第7世代)と、Mシリーズチップを搭載したすべてのiPadとMacということになる。
これらの機種に限られたのは、Apple Intelligenceには高い処理能力が必要だから。そして、一番安価なiPad(第10世代)と継続販売されているiPhone 15以外の現行全モデルをApple Intelligence対応機種にするところに、Apple Intelligenceに重きを置くアップルの姿勢がうかがえる。

IT業界全体が、生成AIに全振りしている状態にあるが、アップルの姿勢は他社と少し違うように思える。ただ、高い機能を得ようとか、AGIを創出しようとかではなく、あくまで現行のiPhone/iPad/Macのインターフェイスをさらに便利にしようというところに目的があるように思える。
『口頭で、「これまでに受け取ったメールとSlackの中身を確認して、明日のミーティングに必要な手はずを整えておいて」と言えば、日時を調整し、会議室を予約して、参加者に連絡をしてくれる。人間はその間にミーティングの内容についてゆっくり思考を深めるとこができる』というのが、Apple Intelligenceの目指すところであるように思える。現状はまだそこにはほど遠いが、少なくとも第1歩は踏み出している。
それでは、Apple Intelligenceの日本語版についてレポートしよう。
Siriの利便性は向上しているが、まだ進化の余地はありそう
まず、利便性が向上するのはSiriだ。
試用してみて、多少聞き取り能力が増していたり、できることが増えているように思う。ただ、まだ爆発的に多機能になっているというわけではない。
文脈は理解するようになっていて、たとえば
「リマインダーに、『牛乳を買う』と入れて」
と言ったあとに、
「あ、ほうれん草もお願い」
と言うと、ちゃんと
○牛乳を買う
○ほうれん草を買う
という項目が出来ている。
これは文脈を理解しているからこそできることで、従来のSiriにはできない。
「来週の水曜日の13時から『山田さんとミーティング』という予定を入れて……あ、やっぱり木曜日にして」
というような、口語的なやりとりにも対応できる。
「センター北駅から、表参道駅への所要時間を教えて」
と言ったあとに
「徒歩だったら?」
と連続的に聞いてもそれぞれの所要時間を表示してくれる。
また、ウェブサイトを開いて「このページを読んで」というと読み上げてくれる(「読み上げて」とうとChatGPTに送ろうとする。難しい……)。また、『要約する』という機能も使える。
また、一部の機能で、ChatGPTとの連携も可能になっている。たとえば「アップル関連情報サイトの企画として、iPhoneの便利な利用法について、企画を10個考えて」と言えば、『そのためにはChatGPTと連携する必要があります。連携していいですか?』とお伺いを立てたあとに、ChatGPTに聞いた情報を表示してくれる。つまりは、Apple IntelligenceがChatGPTのプロンプトを考えて、ChatGPTと連携してくれているのである。
また、画面にウェブサイトを表示して「この写真に何が写っている?」と聞くとChatGPTに聞いて教えてくれる。
全体にはSiriはかなりレベルアップしていて、従来より、いろいろな頼みごとをすることができる。とはいえ、Siriとの会話全体について、ChatGPTの『アドバンスドボイスモード』のような流暢さがあるかと言えば、そこまでには至っていないと思う。便利になっている部分もあるが、全体で見ると上手くいっていない部分もあるので、そこが印象の足を引っ張っているように思う。
「○○さんに電話して」とか「○○さんにメッセージして」という機能も、上手く動作することもあるがしないこともある。どうも、日本語の名前のよみがなが上手く認識されていないのかもしれない。「ふりがなを入れていないせいかな?」とも思ったが、ふりがなが入ってる名前を見つけられないこともあった。このあたりは、今後改善されるかも……とは思うが、連絡先アプリについてはもともと使いにくさがあるので、そのあたりの問題かもしれない。
一番役に立ちそうな、作文ツールに『クラリネットを壊した時の謝罪文』を書かせてみた
一番役に立つのは作文ツール(英語版ではWriting Tools)だろう。
作文ツールは、基本的には元の文章を修正する、整えるという機能を持つ。たとえば、我々がよく作る必要がある、本のページの企画意図を説明して、機材を借用するというドキュメントを書くとしよう。
左のようにだいたいの要件を口頭で入力する。そして、『プロフェッショナル』のボタンを押せばご覧の通り。それなりにちゃんとしたドキュメントになる。便利。もちろん、実際の仕事としては、ここからさらに詰めなければならないかもしれないが、叩き台にはなる。
続いて、お借りした機材を壊した場合の謝罪文を書いて見よう。
音声入力で、ぱぱっと話して清書してもらう。こんな感じ。ていねいな感じになった。
では、パパからもらったクラリネットを壊してしまった時はどうだろうか?
これはさすがに、やってくれない。こういうクリエイティブ過ぎる文章は受け入れてくれないらしい。
では、多少改変して、こうしたらどうか。
……なんとか、文章にしてくれた。エライ(笑)
「大変申し訳ございませんが、お許しいただけますでしょうか?」は面白すぎるw
なお、ゼロから書き起こすと、ChatGPTの力を借りることになる。そうすると、これはもうすんなりとしたドキュメントを作ってくれる。
もはや、「家族にとっても音楽を通じて数多くの思い出と……」と、物語が生成されていて、「専門家に相談して」とか対応策まで出てくる。その上「お慈悲を求めるばかりですが……」と、時代劇みたいな感じになってくる。腹を召す話にならなきゃいいけど(笑)
この差、Apple Intelligenceが基本iPhoneの中で動いていること、ChatGPTが専用のサーバーを使ってこの数年熟成を続けていることを考えると仕方ないところだが、出来具合に差はあるので、真剣に謝罪文を書かなきゃいけないハメになったら、ChatGPTの力も借りた方が良さそうだ。
3月初旬には、しばらく『作文ツール』に文章を訂正させるのが流行りそうだ。
ドキュメントの中の挿し絵に、マジックワンドは使えるか?
面白いといえば、ドキュメントの中で使えるマジックワンドも面白い。たとえば、こんな感じで、だいたいの絵を描いておいて、マジックワンドで囲む。そして、何を描いたつもりなのか、ざっくりとテキストで書き込むとご覧の通り、画像を生成してくれる。
こちらはiPhoneに指で描いてるからイマイチな元絵だが、iPadとApple Pencilで描いたイラストを元に画像を生成してもらうと、説明イラストなどに使えるといいなと思うが、『翼の生えた虹色のシマウマ』のような奇天烈なものを生成するのにはいいが、具体的なものを生成しようとすると急に上手くいかなくなるのが難しいところ。
イメージプレイグラウンドは、ご想像通りアメリカンテイスト
こんどはイメージプレイグラウンドで遊んでみよう。
これは、ご想像の通り、日本人にはテイストの合わないバタくさい画像を生成してしまう。特に、人物に関しては、およそ好みには合わないと思うが……。
撮った写真を元に、テイストを変えてイラストにしてくれる機能は、もしかしたら、役に立つことがあるかもしれない。
生成AIの画像生成AIに関しては、詐欺とか、ディープフェイクといった問題がつきまとうが、Apple Intelligenceに関しては、当分はその心配はなさそうだ(というか、問題ないようにしようとしたから、こうなったのだと思うが)。
目の前のものを解説してくれるVisual Intelligenceは便利そう
Visual Intelligenceもなかなか楽しめる機能だ。
撮影したものに、イベントなどの日程が入ってると、それをワンタップでカレンダーに登録してくれる。
写真の内容を『質問』するとChatGPTに投げて確認してくれる。『検索』すると、Googleの検索結果を表示してくれる。
ちなみに、写真は今日の私の昼ご飯。トマトソースまでは当たっているが、シーフードではなくチキンだ。少し違う。
こちらは、正確に室内にあるレモンの木だと認識してくれた。これはすごい。リビングルームというような漠然としたものも認識してくれる。
コミックスの『キングダム』の表紙を見せたらそれが『キングダム』であることを認識してくれた。タイトルロゴを読んでるのかと思って、タイトルロゴをを見せずにイラストだけ見せてもキングダムだと認識する。これはすごい。もっとも、これはApple Intelligenceではなく、ChatGPTの能力なのだが。
そうそう、名刺を撮って連絡先に入れることもできる……が、まだイマイチ上手くいかない。これは日本の名刺のいろいろな条件をしっかり学習させれば便利な機能になりそうなのだが。
いずれにしても、誰もが持ってるiPhoneのカメラでこれができるというのはすごい。
カメラコントロールボタンは、むしろこのために存在したのかもしれない(が、iPhone 16eではアクションボタンを使う必要がある)。
全体としてまだ進化の余地はあるが、iPhoneから『即使える』のが便利
まだまだ、いろいろな機能がある。
たとえば、すでに紹介している音声の録音と文字起こしの機能もApple Intelligenceの機能だ
優先通知や、集中モードの『さまたげ低減』もそう。そういえば、iOS 18.4(デベロッパーベータ)をインストールしたiPhone 16 Pro Maxで、『さまたげ低減』をセットすると、連携しているiPhone 16 ProやMacもすべて『さまたげ低減』になった。他のはまだApple Intelligence非対応のOSなのに。
全般として、まだ使い勝手の悪い機能や、不十分な機能はあるが、iPhoneという誰もが持っているデバイスに、これほど生成AIの機能がパッケージされているというのは非常に面白い。まだまだ、意図的に使わないと、Apple Intelligenceが自動的に使われるということはないが、便利なので、そのうち多くの人が使うようになるだろう。まだ、多少洗練されていないが、そのうちきっとこれが日常になるはずだ。
(村上タクタ)
関連する記事
-
- 2025.02.20
新型はSE4ではなく、iPhone 16e。ギリ10万円切りで、ホームボタンなし
-
- 2025.02.05
iPhoneのアップル純正新アプリ『Appleインビテーション』使ってみた
-
- 2025.01.30
多様性が危機に瀕する時代に、アップルから新しいBlack Unityコレクション登場