BEMAロゴ

エンジニアの
成長を支援する
技術メディア

NotebookLMで社内情報を一元化!Google Workspace環境でのファイル取り込み

この記事は「BEMA Lab Advent Calendar 2025Open in new tab」の7日目の記事です。
※本アドベントカレンダーの7日目の投稿となります。

こんにちは、株式会社メンバーズデブオプスリードカンパニーOpen in new tabの兼子です。
以前NotebookLMを利用して、社長の思考をAIで分析しました。(前回の記事はこちらOpen in new tab
今回は、採用チームと一緒に取り組んでいる、NotebookLMを活用した社内情報整理プロジェクトについてご紹介します。
Google Workspaceを利用している企業で、情報が散らばって困っている方、NotebookLMで効率的にナレッジを統合したい方に向けて、実践的なノウハウをお届けします。

はじめに:散らばる情報、困る採用チーム

採用活動は、多岐にわたる情報を扱います。会社概要、制度説明資料、過去の面接記録、評価基準、FAQなど。これらの情報はGoogle Workspace上のさまざまな場所に分散しています。

「あの資料、どこにあったっけ?」

採用チームのメンバーから、こんな声をよく聞きました。Google Document、Spreadsheet、PDF、そしてGoogle Sitesに散らばった情報を探すだけで、貴重な時間が失われていました。

そこで、NotebookLMを使って、これらの情報を一元化するプロジェクトをスタートさせました。目標は、「どこに何があるか探す時間をゼロにして、採用活動の質を上げること」です。

取り組みの全体像:ファイルタイプ別の戦略

まず直面した課題

プロジェクトを始めてすぐに気づいたのは、社内ファイルの多様性でした。Google Workspace環境では、以下のような複数のファイルタイプが混在しています。

  • Google Document
  • PDF
  • Google Sheets
  • Google Sites

そして、これらのファイルタイプごとに、NotebookLMへの取り込み方法が異なることが判明しました。

ファイルタイプ別の分類と優先順位付け

まず、各ファイルタイプの特性を整理し、取り込みの難易度を評価しました。(2025/7月時点)

ファイルタイプ

取り込み難易度(当初)

Google Document

PDF

Google Sheets

Google Sites

最高

この分類により、まずはGoogle Documentから着手し、段階的に他のファイルタイプへ展開していく戦略を立てました。

技術的な課題と解決策:ファイルタイプごとの攻略法

それでは、各ファイルタイプをどのように攻略したのか、具体的に見ていきましょう。

Google Document

課題:なし

解決策:NotebookLMはGoogle Documentをネイティブサポートしているため、共有リンクをそのまま貼り付けるだけで読み込めます。

これは最も簡単なパターンで、採用チームの議事録や制度説明資料をスムーズに取り込むことができました。

PDF

当初の課題: PDFファイルは、一度ローカルにダウンロードしてから、NotebookLMに手動でアップロードする必要がありました。ファイル数が多いと、この作業だけで膨大な時間がかかります。

解決策: 2025年11月、Googleが発表したNotebookLMの大型アップデートにより、Google Drive上のPDFファイルのURLを直接読み込めるようになりました。

実装方法

  1. Google Drive上のPDFファイルを右クリック
  2. 「リンクを取得」を選択
  3. URLをコピーして、NotebookLMのソース追加画面に貼り付け

このアップデートにより、PDFファイルをダウンロードせずに即座に取り込めるようになりました。作業効率が劇的に向上した瞬間です。

PDFのソースがダウンロードして追加したものなのか、URL共有で追加したものなのかは、ソースの部分にリンクがあるかどうかで判断することができます。URL共有で追加したものについては、ドライブのリンクが付与されているので、それで確認することができます。

Google スプレッドシート

当初の課題:スプレッドシートは、スプレッドシートの内容を一度Google Documentに添付する必要がありました。

解決策: 2025年11月、Googleが発表したNotebookLMの大型アップデートOpen in new tabにより、直接読み込めるようになりました!

これらのデータをNotebookLMに取り込むことで、データの中身の質問に対しても、AIが答えられるようになりました。

Google Sites

課題:Google SitesはNotebookLMのネイティブサポート対象外です。しかし、社内の重要な情報がSitesにまとまっているケースも多くあります。

解決策:Pythonのスクレイピング技術を使って、サイトのテキスト情報を抽出しました。

技術詳細

動作環境については、Python3.9.6を利用しました。

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from bs4 import BeautifulSoup
import time

# Chromeをヘッドレスモードで起動
chrome_options = Options()
chrome_options.add_argument("--headless")
driver = webdriver.Chrome(options=chrome_options)

# Google Sitesのページを開く
url = "https://sites.google.com/example.com/your-site"
driver.get(url)
time.sleep(3# ページの読み込みを待つ

# ページのHTMLを取得
html = driver.page_source
soup = BeautifulSoup(html, 'html.parser')

# テキストコンテンツを抽出
text_content = soup.get_text()

# Markdownファイルとして保存
with open('site_content.md', 'w', encoding='utf-8') as f:
    f.write(text_content)

driver.quit()

このスクリプトで抽出したMarkdownのテキストファイルを、NotebookLMにアップロードすることで、Google Sitesの情報も統合できました。

残る課題:画像内のテキスト情報(例:図表内の説明文)は、このままでは取得できません。

今後の展望:同じく11月のアップデートで、NotebookLMは画像認識機能も追加されました。この機能と組み合わせることで、画像内のテキストも読み取れるようになるため、より完全な情報取得が可能になると期待しています。そのため、スクレイピングのほかにスクリーンショットを取得してその取得したスクリーンショットをソースに追加したいです。

成果と効果:採用活動への具体的なインパクト

採用チームからはこんなフィードバックをもらいました。

情報検索時間の短縮

従来は、「あの制度の詳細はどこだっけ?」と思ったら、複数のフォルダやSitesを探し回る必要がありました。今では、NotebookLMに質問するだけで、関連する情報と出典元が即座に表示されます。

学びと今後の展望

このプロジェクトを通じて、いくつかの重要な学びがありました。

学んだこと

ファイルタイプごとの特性を理解することの重要性

最初から完璧を目指すのではなく、まず簡単なGoogle Documentから着手し、段階的に難易度を上げていったことが成功の鍵でした。

Googleのアップデートを追うことで解決できる課題もある

PDFやSheetsの取り込みは、当初は大きな課題でしたが、Googleのアップデートにより自然に解決されました。技術の進化を追い続けることの大切さを実感しました。

完璧を目指さず、段階的に改善していくアプローチ

Google Sitesのスクレイピングも、画像情報の取得などまだ完璧ではありません。しかし、一部の情報をNotebookLMにを統合できただけでも、十分な価値がありました。

今後の展望

画像認識機能との組み合わせでGoogle Sitesの情報取得を完全化

NotebookLMの画像認識機能を活用すれば、図表やスクリーンショット内のテキストも抽出できるようになります。

まとめ

今回のプロジェクトを通じて、技術的な工夫によってGoogle Workspace環境の情報を統合できることを実証しました。まだすべての情報をNotebookLMで管理できるようになったわけではありませんが、管理するための道筋ができたと考えています。

NotebookLMは、単なるAIツールではありません。組織のナレッジを活性化させ、誰もが必要な情報にすぐアクセスできる「情報の一元化」を実現する基盤です。採用活動だけでなく、営業、マーケティング、開発、教育など、あらゆる部署で活用できる可能性を秘めています。

この記事が役に立ったと思ったら、
ぜひ「いいね」とシェアをお願いします!

リンクをコピーXでシェアするfacebookでシェアする

この記事を書いた人

兼子 大地
兼子 大地
デブオプスリードカンパニーで、インフラやAIまわりのエンジニアをしています。
詳しく見る
ページトップへ戻る