自分の中で「録音」の意味が変わった1年 by西田 宗千佳
ライターにとって、仕事のためのツールを整備することは大切なことだ。
とはいえ、世の中には「最適化する趣味」というものが存在していて、「どんなツールや配置がベストかを考え、実践するのが面白い」という話もある。取材の録音手法や機材の最適化は、仕事上必須のものではあるが、明らかに趣味の世界に突っ込む部分もあったりする。手段と目的の関係はなかなか微妙な関係だ。
この「最適化する趣味」というのはPCやガジェットを軸にする上でとても重要な概念であり、料理やキャンプ、インテリアまで広く敷衍できる面白い概念だ。
その辺の話は筆者のnoteで有料記事を書いているので、ご興味があればご覧いただきたい。
それはともかくとして、今年は自分の中で「録音」の考え方が変わった年でもあった。これは趣味というよりは確実に「実益」の領域だ。
少しその話をしてみたいと思う。
取材録音には、過去からいくつかの流れがあった。
この仕事を始めた1990年代はテープやMD。筆者は1990年代末にはICレコーダーに移行しているので、結果として、取材録音の大半はデジタルデータとして残っている。
そこからICレコーダーの時期は長く続く。他の記者の取材スタイルを見ると、いまだこれが主流という部分もある。
取材内容の確認では「録音の書き起こし」が必要だが、以前は人間の手作業であり、非常に面倒なものだった。だからこそインタビューなど「その必要があるとき」しか行なわないもの、という認識もあった。
そこに2010年代後半、AIによる書き起こしが登場する。こうなると、すべての録音資料は「書き起こされるのがあたりまえ」になっていく。
しかし、今年はこのプロセスが変わった。
すべてを変えたのは「NotebookLM」である。
結果だけを言えば、もはや「書き起こし」は執筆作業の前にすることではない。リアルタイム・オンデバイス書き起こしも重視していない。
録音は必須で重要だが、書き起こしは「チェックのために行なう」ものに変化しているのだ。
NotebookLMは、Googleが提供しているAIサービスだ。資料や音声、ウェブサイトなどを登録すると、「その内容に関して質問しつつ内容を確認できる」と考えればいい。
NotebookLMというと、資料を登録すれば音声や動画、プレゼンテーションができる、といったことが注目される。たしかにその能力はすさまじい。
しかし、毎日のように使っていると、そういう「アウトプット」の部分は、少なくとも自分にとっては本質ではない、ということが見えてくる。
ポイントは「内容を質問できる」ことにある。
NotebookLMは、特定の「ノート」に登録した資料の内容について質問・検討してその内容を残せるサービスだ。情報をまとめるという意味では、ノートではなく「バインダー」だと考えた方がわかりやすいかもしれない。
そして、そのバインダーに対して「この人はどんな話をしていた?」「Aについては誰が言及していた?」といった感じで質問し、内容を確認できる。
ノートに登録しておけるのは、テキストやPDF文書に加え、YouTubeの動画やウェブサイトなど。もちろん音声ファイルでも大丈夫だ。音声や動画は内部的に書き起こされて、AIが質問に利用可能なデータになって保持される。
ここで重要なのは、「複数の言語が混ざっていても問題ない」という点だ。
今もAI書き起こしでは、英語と日本語が混ざるのが苦手だったりする。さらに中国語などが混ざると翻訳精度は厳しいものになる。
だがNotebookLMでは、言語が複数混ざっても、話者が多数いても、複数の会話に分かれていても、それらをまとめて分析の対象としてくれる。
登録後質問可能になるまでの時間は数分程度で、待ち時間も短いものだ。
その結果、記事を書く準備段階での荒い事実確認は、NotebookLMとの対話で進めると効率的に終わるようになった。
もちろん、音声だけでは情報が不足する。
自分が取材中に書いたメモやその他の発表資料なども入れておくことで、回答の内容は充実していく。
書き起こしサービスやボイスレコーダーの中には、NotebookLMと同じように、書き起こしを翻訳・要約し、内容について質問できる機能を持ったものも増えた。
しかし、NotebookLMは音声だけでなくさまざまな資料や文章も加味して使えるのが特徴だ。結果として、その案件すべての視聴をまとめて作業できるからこそ使い勝手が良い……という話になる。まさに「案件ごとのバインダー」であるところに利便性がある、という見方もできそうだ。
AIがまとめるからハルシネーションが……と考える人もいるだろう。だが、ノートブックに登録した内容だけをAIが取り扱うので、一般的なAI検索などとは状況が違い、ほぼ問題はない。
さらにいえば、筆者の場合「自分が取材した内容」をベースに質問しているので、間違いや違和感も感じやすい。違和感を感じたら引き返す……というか、元のデータを見て確認すれば良い、という感じだ。
なお、発言の書き起こしが必要になったら、「時系列に沿って書き起こして」とお願いするのが良い。さらに翻訳が必要な場合には「日本語でまとめて」とお願いすればいい。
いうまでもないことだが、NotebookLMから出てくる内容がそのまま記事になることはない。単語やフレーズの断片ぐらいは残るが、構成も内容も自分で書く。
記事には記事の目的がある。AIが出力した文章は目的に合っていないし、そもそもそんな書き方を読者も編集者も私に求めてはいないだろう。
ただ、これまでは色々なものを見比べながらやっていた作業の一部が省力化できることは、私個人にとっては大きな意味がある。
なお、NotebookLMについては、データや質問、回答などがGoogle側でAIのトレーニングに利用されることはない。これは有料版・無料版ともに同様だ。
Google Workspaceアカウントで企業や教育機関が使う場合も同様であり、さらに、機能改善を目的に、フィードバック内容の確認のために「人間のレビュワーが確認する」こともないという。
筆者の場合にはGoogle Workspaceを介して有料版を利用しているが、登録可能なノートブックの数量を気にしないなら、無料版で試してみる形でも良いだろう。
とはいえ、企業内文書やNDAなどの非開示条件のある文書では、それぞれの組織や契約上の利用ルールが優先する。業務で利用する場合には、その点に留意してほしい。筆者もNDAを含んだ資料では利用してない。
また、NotebookLMに一度登録したデータは、今のところ、「元の形式のまま取り出す」ことができない。これは大きな欠点だ。NotebookLMは便利だが、ある種ブラックホールのようなサービスでもある。
資料として登録するデータは、文書にしろ音声ファイルにしろ、別途保存しておくことをお忘れなく。
ソースにあたって内容を確認するにも、元のデータは必須だ。
結果として、最近は録音機材にあまりこだわらなくなった。結局、どれで録音してもNotebookLMに登録してしまえば良いからだ。
昔のAI書き起こしはノイズに弱かったが、今は雑踏の音やタイプ音などのノイズがあっても、かなり正確な書き起こしができる。
そもそも、NotebookLMがサービスの背後でやっている書き起こしは、他に比べても文章としても質は劣っている印象があるのだが、目的が「AIが質問に答えるための情報」なので、意外と影響は少ない。
過去には音質重視の単体レコーダーを使っていたこともあるが、今は結局、iPhoneかPixelかを使っている。スマホは必ず持っているし、クラウドを経由し、PCからの利用も楽だ。
実は良い録音機能があるスマホでも、クラウドからのPC連携が使いやすいものは少ない。あとはシャオミ……という感じだろうか。もちろん、アプリやクラウドストレージを組み合わせるとどのスマホでも同じことを実現することはできるのだが、公式サービスからサクサクできるものとして、アップルとGoogleがおすすめだ。
最近も色々単体レコーダーが出ているが、データ転送と機器のバッテリー管理を考えると、持ち歩く機会が多く充電管理も楽なスマホで……と考えている。「AIでの書き起こし」を謳うレコーダーであっても、書き起こしには長い時間がかかるものもある。そこも、NotebookLMの方がいい。さらに、専用サービスには利用コストがかかることを考えると、安価なNotebookLMの方が優位である。
常に録音し続け、AIで必要な情報を検索して使うことを前提とした機器もあるが、プライバシーやデータ、バッテリー管理の問題まで考えると、結局、必要な時に録音ボタンを楽に押せる方が便利であると判断している。また、その種の小型録音機器はスマホより音質が悪く、いざという時の聞き直しに向かない……という印象も強い。
ただ、スマホで録音するにしろ、イベントなどのうるさい場所で自分と相手の声をもう少し音質を上げたい、という欲求はある。ただ、そのために機材が複雑になるのも本末転倒な気がしている。
インタビューの動画や音声をYouTubeなどで公開することが前提なら、また話は違うだろう。だが、現状の筆者の取材環境ならこれで良いか……という気がしている。
と言いつつ、なにかすごく快適そうなガジェットやサービスが出てきたら、まず試してみるだろうとは思う。
結局、「試すのが楽しい」という事実は否定できないのだ。