BigQuery サンドボックスに無料でエクスポート

BigQuery Export の利用を開始する方法は2種類

サービス名公式サイトクレジットカードの 事前登録
Google Cloud Platform(GCP)無料トライアル無料枠を利用するためには、登録時にクレジットカード情報の登録が必要。 無料枠を使い切っても、自動で課金されることは無い。



BigQuery サンドボックスについて


BigQuery サンドボックスには次の制限があります。

すべてのデータセットにデフォルトのテーブル有効期限が設定されています。また、デフォルトのパーティション有効期限は 60 日間に設定されています。テーブル(、ビュー(、パーティション分割テーブル(のパーティションは、60 日後に自動的に有効期限が切れます。

サンドボックス プロジェクトでサポートされていないものは、次のとおりです。


サンドボックスの制限をなくすには、プロジェクトをアップグレード(=有料版への移行)し、リソースの有効期限を削除または更新します。サンドボックスからアップグレードした後も、無料枠( )を使用できますが、料金が発生する場合があります。 BigQuery の割り当てを管理するには、費用管理( )の設定を検討してください。





Google Cloud Platform の画面が表示されます。


Google API Console プロジェクトを作成するか、既存のプロジェクトを選択します。





「プロジェクト名」(図(1))を入力すると、「プロジェクト ID」 (図(2))の候補が自動的に入力されますが、変更できます。 「プロジェクト ID」は後で変更できないので、変更したい場合は、ここで変更しておく必要があります。「プロジェクト ID」を変更するか、またはそのままで「作成」をクリックします。


Google API の確認

左上のナビゲーション メニューを開き、「API とサービス」 > 「ライブラリ」 の順にクリックします。


APIライブラリで、BigQueryを検索し、検索結果をクリックします。BigQuery APIが有効になっていれば、そのままで。有効になっていなければ、有効にしてください。

Cloud プロジェクトにサービス アカウントを追加していることを確認

Cloud プロジェクトにサービス アカウントを追加していることを確認します。 がプロジェクトのメンバーとして追加されており、編集者の基本ロールが割り当てられていることを確認し、必要に応じてアカウントを追加します。


公式ヘルプ: に BigQuery データ編集者のロールを設定して、保存します。


BigQuery は、Google Cloud Platform のメニュー内、「分析」から利用できます。

「固定」を利用すると、 BigQueryをメニュー上部に固定することができます。

BigQuery を GA4 プロパティにリンクする

管理 > プロパティ列 > BigQueryのリンク をクリック。

GA4にログインします。 BigQuery プロジェクトの所有者権限と、リンクするGA4データ ストリームを含むアナリティクス プロパティの編集者の役割を持つメールアドレスを使用します。


「BigQuery プロジェクトを選択」をクリックして、読み取り権限以上の権限を持つプロジェクトのリストを表示します。

リストからプロジェクトを選択し、「確認」 をクリックします。



公式ヘルプ: データセットのロケーション

エクスポートに含めるデータ ストリーム、およびエクスポートから除外する特定のイベントを選択するには、「データ ストリームとイベントを設定」を選択します。


(標準プロパティでは、BigQuery Export の 1 日の上限は 100 万イベント(Google アナリティクス 360(Google アナリティクス 4 プロパティ)の場合はヘルプに「数十億件のイベント」と記載されている。 )です。



広告識別子を含める場合は、「モバイルアプリ ストリーム用の広告識別子の追加」を選択します。


「次へ」 をクリックします。


BigQuery ストリーミング エクスポートでは、BigQuery Export を介して当日のデータを数分以内に入手できます。

このエクスポート オプションを使用すると、BigQuery に最新のデータを読み込んで、ユーザーとプロパティのトラフィックを分析できます。

ストリーミング エクスポートでは、毎日新しいテーブルが 1 つ作成されます。

events_intraday_YYYYMMDD(イントゥラデイ=その日のうちに、の意): 内部ステージング テーブルです。このテーブルには、その日に発生したセッション アクティビティのレコードが保持されます。ストリーミング エクスポートはベスト エフォート型の処理であり、イベントの遅れやアップロードの失敗などにより、データに漏れが生じる場合もあります。データは 1 日を通して継続的にエクスポートされます。セッションが複数のエクスポート周期にまたがっていると、テーブルにはそのセッションのレコードが複数保存されることがあります。このテーブルは、events_YYYYMMDD の作成が完了すると削除されます。

ストリーミング エクスポートを選択した場合、次のテーブルも毎日作成されます。

events_YYYYMMDD: 1 日に 1 回、すべてのイベントがエクスポートされます。

その日の安定したデータセットを分析できるよう、クエリでは、events_intraday_YYYYMMDD ではなく events_YYYYMMDD を使用するようにしてください。




たとえば、ユーザーが(商品をカートに追加するなど)興味を示したもののコンバージョンに至らなかった場合、その直後に割引を提示すると効果的であることがわかっています。最適なタイミングで割引をアピールすると、多くのユーザーが再びサイトを訪れ、コンバージョンを達成する可能性が高まります。そのためには、最新のデータを利用して該当する ユーザーをすばやく見つけ、ユーザーの関心を引き付ける広告を絶好のタイミングで配信しなければなりません。


頻繁なデータ更新は、問題のすみやかな特定と解決にも役立ちます。また、文化的トレンドをいち早くキャッチして、情報を発信することもできます。BigQuery は、こうしたデータ運用の重要な部分を担います。CRM システム、コールセンター、実店舗など、現在 Google アナリティクスでは利用できないデータを取り込むことで、顧客、問題点、新たなトレンドを深く理解することができます。


BigQuery を GA4 プロパティにリンクする(リンクを完了させる)



  1. BigQuery へのリンクを削除します(後述)。
  2. データを BigQuery の別のデータセットにバックアップ(移動(またはコピー(します。
  3. 元のデータセットを削除(「します。次のステップで必要になるため、名前を控えておきます。
  4. 削除したデータセットと同じ名前で新しいデータセットを作成し、データのロケーションを選択します。
  5. バックアップしておいたデータを、新しいデータセットにコピーします。
  6. 上の手順を繰り返して、BigQuery へのリンクを新たに作成します。



BigQuery へのリンクを削除する


「プロパティ」列の 「BigQuery とのリンク」をクリックします。



画面右上の その他 > [削除] の順にクリックします。

解説:BigQuery Export に関する制限

標準プロパティでは、BigQuery Export の 1 日の上限は 100 万イベント(Google アナリティクス 360(Google アナリティクス 4 プロパティ)の場合はヘルプに「数十億件のイベント」と記載されています。 )です。プロパティがエクスポートの上限を継続的に超えると、BigQuery の日次エクスポートは一時停止され、それ以前の数日間のエクスポートは再処理されません。

プロパティの編集者と管理者には、自らが管理しているプロパティが 1 日の上限を超えるたびにメール通知が届きます。この通知には、何も対応しなかった場合にエクスポートが一時停止される時期が記載されます。また、標準プロパティが 1 日の上限である 100 万件イベントを大幅に超えると、アナリティクスでは日次エクスポートが直ちに一時停止されることがあります。通知が届いた場合は、データ フィルタリング機能(データ ストリーム エクスポートとイベント除外)( )を利用して、毎日エクスポートするイベント数を減らし、日次エクスポートの作業を継続できるようにしてください。

ストリーミング エクスポート( )に制限はありません。

詳しくは、360 プロパティの機能に適用される制限についてのヘルプ( )をご覧ください。

BigQuery の料金

BigQuery の料金はストレージとクエリ処理に基づいて請求されます。

価格表(をご覧になり、インタラクティブ クエリとバッチクエリの違い(を確認してください。


アナリティクスのデータは 「BigQuery サンドボックス」(前出)に無料でエクスポートすることもできますが、「サンドボックスの制限」(前出)が適用されることにご注意ください。


料金と課金 東京(asia-northeast) (1) ストレージの料金

アクティブストレージ(注1)$0.023 / GB毎月10 GBまで無料
長期保存(注2)$0.016 / GB毎月10 GBまで無料

(注1)「アクティブ ストレージ」には、過去 90 日間で変更されたテーブルまたはテーブル パーティションが含まれます。

(注2)「長期保存」には、90 日間連続して変更されていないテーブルまたはテーブル パーティションが含まれます。そのテーブルのストレージの料金は自動的に約 50% 値引きされます。アクティブ ストレージと長期保存のパフォーマンス、耐久性、可用性に違いはありません。

料金と課金 東京(asia-northeast) (2) データ取り込みの料金

 BigQuery Storage API$0.03 / GB 毎月最初の 2 TB まで無料
ストリーミング挿入$0.012 / 200MB挿入に成功した行が対象課金となります。 最小サイズ1 KBで各行が計算されます。

BigQuery へのデータの読み込みの概要 公式ヘルプ:

料金と課金 東京(asia-northeast) (3) 分析の料金

クエリ(オンデマンド分析)$6.00 / TB毎月1TBまで無料
クエリ(月定額)$2,400 / 100 slots最小スロット数は 100 で、100 スロット単位で購入可能
クエリ(年定額)$2,040 / 100 slots最小スロット数は 100 で、100 スロット単位で購入可能



リンク完了後 24 時間以内に、データが BigQuery プロジェクトにエクスポートされるようになります。

毎日のエクスポートを有効にすると、前日のデータが格納された 1 ファイルが毎日(通常は、レポート作成用に設定したタイムゾーンの午後の早い時間帯に)エクスポートされます。


BigQuery にエクスポートされるデータ

[GA4] BigQuery Export スキーマ


BigQuery にリンクしている GA4 プロパティおよび Firebase プロジェクトごとに、「analytics_<property_id>」という名前の 1 つのデータセットが BigQuery プロジェクトに追加されます。



毎日のエクスポート オプションまたはストリーミング エクスポート オプションが有効になっているかどうかにかかわらず、各データセット内に events_YYYYMMDD という名前のテーブルが毎日作成されます。

ストリーミング エクスポート オプションを有効にすると、events_intraday_YYYYMMDD という名前のテーブルも作成されます。(前出)イベントは 1 日中記録されるため、このテーブルには継続的にデータが入力されます。このテーブルは、events_YYYYMMDD の作成が完了すると 1 日の終わりに削除されます。(BigQuery サンドボックスの場合、1 日の途中にはイベントはインポートされず、追加で適用される上限設定があります。当日にインポートする場合は、サンドボックスからアップグレードしてください)


BOOLEAN(ブーリアン)TRUE または FALSE(フォールス)
FLOAT浮動小数点型 小数部分を持つ数値

主なデータ型 RECORD








  • [string_value]=文字列を格納する。
  • [int_value]=整数を格納する。
  • [float_value」=浮動小数点型のデータを格納する。
  • [double_value]=有効桁数の多い小数を格納する。


BigQuery にエクスポートされるデータスキーマ




app_info.idSTRINGアプリのパッケージ名またはバンドル ID。
app_info.firebase_app_idSTRINGアプリに関連付けられている Firebase アプリ ID。
app_info.versionSTRINGアプリの versionName(Android の場合)または short bundle version。
device.mobile_os_hardware_modelSTRINGオペレーティング システムから直接取得したデバイスのモデル情報。
device.operating_systemSTRINGデバイスのオペレーティング システム。
device.operating_system_versionSTRINGOS のバージョン。
device.vendor_idSTRINGIDFV(IDFA を収集していない場合にのみ使用)。
device.advertising_idSTRING広告 ID または IDFA。
device.languageSTRINGOS の言語。
device.time_zone_offset_secondsINTEGERGMT との時差(秒単位)。
device.is_limited_ad_trackingBOOLEANデバイスの広告トラッキング制限の設定。iOS14 以降では、IDFA がゼロ以外の場合、false が返されます。
stream_idSTRINGストリームの数値 ID。
user_idSTRINGsetUserId API によって設定されるユーザー ID。
user_pseudo_idSTRINGユーザーの仮の ID(アプリ インスタンス ID など)。
user_propertiesRECORDsetUserProperty API によって設定される、ユーザー プロパティの繰り返しレコード。
user_properties.keySTRINGユーザー プロパティの名前。
user_properties.valueRECORDユーザー プロパティの値を格納するレコード。
user_properties.value.string_valueSTRINGユーザー プロパティの文字列値。
user_properties.value.int_valueINTEGERユーザー プロパティの整数値。
user_properties.value.double_valueFLOATユーザー プロパティの倍精度値。
user_properties.value.set_timestamp_microsINTEGERユーザー プロパティが最後に設定された時刻(ミリ秒単位)。
user_ltvRECORDユーザーのライフタイム バリューに関する情報を格納するレコード。このフィールドは当日表では使用されません。
user_ltv.revenueFLOATユーザーのライフタイム バリュー(収益)。このフィールドは当日表では使用されません。
user_ltv.currencySTRINGユーザーのライフタイム バリュー(通貨)。このフィールドは当日表では使用されません。
キャンペーン 注: traffic_source のアトリビューションは、クロスチャネルのラストクリックに基づいています。traffic_source の値は、ユーザーがインストール後に次のキャンペーンを操作しても変更されません。
traffic_sourceRECORDユーザーを最初に獲得したトラフィック ソースの名前。このフィールドは当日表では使用されません。
traffic_source.nameSTRINGユーザーを最初に獲得したマーケティング キャンペーンの名前。このフィールドは当日表では使用されません。
geo.continentSTRINGイベントが報告された大陸(IP アドレスベース)。
geo.sub_continentSTRINGイベントが報告された亜大陸(IP アドレスベース)。
geo.countrySTRINGイベントが報告された国(IP アドレスベース)。
geo.regionSTRINGイベントが報告された地域(IP アドレスベース)。
geo.metroSTRINGイベントが報告された大都市圏(IP アドレスベース)。
geo.citySTRINGイベントが報告された都市(IP アドレスベース)。
event_dateSTRINGイベントが記録された日付(アプリの登録タイムゾーンにおける日付を YYYYMMDD 形式で示したもの)。
event_params.keySTRINGイベント パラメータのキー。
event_params.valueRECORDイベント パラメータの値を格納するレコード。
event_params.value.string_valueSTRINGイベント パラメータの文字列値。
event_params.value.int_valueINTEGERイベント パラメータの整数値。
event_params.value.double_valueFLOATイベント パラメータの倍精度値。
event_params.value.float_valueFLOATイベント パラメータの浮動小数点値。このフィールドは現在使用されていません。
event_bundle_sequence_idINTEGERこれらのイベントをアップロードしたバンドルのシーケンシャル ID。
e コマース  
ecommerceRECORDe コマースに関する情報を格納するレコード。
ecommerce.total_item_quantityINTEGERこのイベントにおけるアイテムの合計数。items.quantity の合計です。
ecommerce.transaction_idSTRINGe コマース トランザクションのトランザクション ID。
ecommerce.unique_itemsINTEGERこのイベントにおける固有のアイテム数。item_id、item_name、item_brand に基づきます。
items.item_idSTRING商品アイテムの ID。
items.item_revenue_in_usdFLOATこの商品アイテムの収益。price_in_usd x 数量によって計算されます。購入イベントに対してのみ入力され、米ドル(標準単位)で表記されます。
items.item_revenueFLOATこの商品アイテムの収益。価格 x 数量によって計算されます。購入イベントに対してのみ入力され、現地通貨(標準単位)で表記されます。
items.item_refund_in_usdFLOATこの商品アイテムの払い戻し額。price_in_usd x 数量によって計算されます。払い戻しイベントに対してのみ入力され、米ドル(標準単位)で表記されます。
items.item_refundFLOATこの商品アイテムの払い戻し額。価格 x 数量によって計算されます。払い戻しイベントに対してのみ入力され、現地通貨(標準単位)で表記されます。
items.item_list_idSTRINGユーザーに商品アイテムが表示されたリストの ID。
items.promotion_idSTRING商品プロモーションの ID。
items.creative_nameSTRINGプロモーション スポットで使用されたクリエイティブの名前。
items.creative_slotSTRINGクリエイティブ スロットの名前。
プライバシー情報 以下のフィールドは、同意モードを使用した場合のユーザーの同意ステータスに基づいています。
privacy_info.ads_storageSTRINGユーザーに対して広告ターゲティングが有効になっているかどうか。有効な値: Yes、No、Unset
privacy_info.analytics_storageSTRINGユーザーに対してアナリティクスのデータ保存が有効になっているかどうか。有効な値: Yes、No、Unset
privacy_info.uses_transient_tokenSTRINGウェブユーザーがアナリティクスでのデータ保存を拒否し、デベロッパーがサーバーデータの一時的なトークンに基づいて Cookie を使用しない測定を有効にしているかどうか。有効な値: Yes、No、Unset

BigQuery の操作


GA4側で確認できるプロジェクト IDは、BigQueryの下記の位置で確認できる。

プロジェクトIDをクリックすると、「analytics_<property_id>」という名前の 1 つのデータセットが表示される。


















集中演習 SQL入門
Google BigQueryではじめるビジネスデータ分析
木田和廣  (著) 
インプレス (2021/2/19)









GROUP BY は列番号を指定してグループ化することができる。
[event_name] [event_count]というフィールド名が並んでいる場合、「1」は[event_name] のことである。

ORDER BYに続けて、並べ替えの基準とするフィールド名を並べ替える。
ORDER BYは列番号を指定して並べ替えすることができる。
[event_name] [event_count]というフィールド名が並んでいる場合、「2」は[event_count] のことである。
ORDER BY で並べ替えの基準とするフィールド名(列番号)を指定した後、ASC(アスク)で昇順の指定、DESC(デスク)で降順の指定ができる。ASCは省略できるので、何もつけない場合は、昇順となる。


SQLの例 page_titleとPV数のデータを作成



  • [string_value]=文字列を格納する。「page_title」のvalueはここに入ります。
  • [int_value]=整数を格納する。
  • [float_value」=浮動小数点型のデータを格納する。
  • [double_value]=有効桁数の多い小数を格納する。




















後半では、「RIGHT OUTER JOIN」を使って、仮想テーブルと、CSVでインポートしたテーブルを連結しています。page_location =url によって結合させています。


RIGHT OUTER JOIN は、FROMで指定するテーブルを左側、RIGHT OUTER JOINで指定するテーブルを右側として、右側は全レコード、左側は右側と共通して持つフィールドの値が重なっているレコードのみを残します。






