AIでスプレッドシートや業務データを扱う前にGitHub側で確認すること

このページは、AIにスプレッドシート編集を丸投げするためのページではありません。CSV、表データ、設定ファイル、顧客情報、売上データ、社内メモをGitHubで扱う前に、公開範囲と混入リスクを確認するためのページです。

GitHubに入れる前に分けるもの

業務データは、コードや記事本文よりも公開事故につながりやすい情報を含むことがあります。AIに渡す前、repoへ入れる前、PRを作る前の3段階で確認します。

スプレッドシートの元データ、CSV、JSON、設定ファイル、集計結果は、公開してよいものと伏せるべきものを先に分けます。

  • 顧客名や連絡先
  • 売上や請求に関する表
  • 社内メモや未公開情報
  • APIキーやtoken
  • 公開用に加工済みのサンプルデータ

AIに表を渡す時の注意

AIに表を渡す場合、正確性や安全性を断定せず、入力する範囲を小さくします。必要なら列名だけ、匿名化した例だけ、または集計後の数値だけにします。

GitHub上では、AIが生成したファイルに元データの行、ローカルパス、認証情報らしい文字列が含まれていないかをPRで確認します。

  • 元ファイルをそのまま渡さない
  • 個人情報を削る
  • 業務上の機密を削る
  • 数式や集計結果を人間が確認する
  • PRで追加ファイルを確認する

スプレッドシート編集後のPR確認

表データを扱う作業では、生成されたファイル数が増えやすくなります。不要な中間ファイル、キャッシュ、ローカルの一時ファイルが混ざっていないかを見ます。

公開サイトへ出す場合は、表の内容だけでなく、内部リンク、sitemap、noindex、画像、スマホ表示も確認対象に入れます。

  • 追加ファイル一覧を見る
  • 差分に実データが出ていないか見る
  • 公開URLに出してよい内容か見る
  • 未作成URLをリンクしていないか見る
  • 戻せるバックアップがあるか見る

関連ページ

GitHub側の確認ページから、Copilot側、Codex側、Sheets側の注意点へ移動できます。

比較表

見るもの確認する理由
PRの差分AIが変更した範囲を人間が確認するため。
Secrets候補APIキー、token、.env、接続情報を公開しないため。
業務データ顧客情報、売上、社内情報を混ぜないため。
公開URL作ったページやリンクが200で開けるか確認するため。

FAQ

private repoなら業務データを入れてよいですか?

private repoでも、権限、共有範囲、外部連携、AIに渡す内容を確認します。安全とは断定しません。

AIにスプレッドシートをそのまま渡してよいですか?

そのまま渡す前に、個人情報、顧客情報、売上、社内情報、認証情報を削るか、匿名化します。

GitHubでは何を見ればよいですか?

PRのファイル一覧、diff、追加されたデータ、Secretsらしい文字列、公開範囲を見ます。