LPのA/Bテストのやり方｜仮説設計から結果分析まで5つの手順で解説

公開日: 2026年5月27日 · 読了目安 12 分

LP(ランディングページ)のA/Bテストのやり方を、仮説設計・サンプルサイズ計算・結果分析まで5つの手順で解説します。CVRを継続的に改善するテスト運用のコツが分かります。今日からデータに基づくLP改善を始めましょう。

LPのA/Bテストが改善に不可欠な理由

LPの改善は感覚ではなくデータに基づいて行うべきです。デザイナーやマーケターが「良いと思う変更」が、実際にはCVRを下げることも珍しくありません。

A/Bテストは、複数のバリアントを実際のユーザーに表示し、統計的に優れた方を選ぶ科学的な意思決定プロセスです。

LPでは、ヒーローのコピー一文・CTAボタンの色・画像の選択のような小さな変更が、CVRに10〜30%影響することがあります。継続的にテストを回すチームは、同じ広告費でも獲得コストを下げ続けられます。

重要なのは「やり続けること」です。単発の1回テストより、月1〜2回のテストサイクルを6ヶ月継続した方が、累積の改善幅は大きくなります。

手順1：A/Bテストの優先順位を決める

テスト対象の優先順位は「インパクトの大きさ×確信度×実装のしやすさ」で評価します。CVRへのインパクトが大きい順に、ヒーローのコピー→CTA文言とボタン色→ファーストビューの画像→社会的証明の位置→フォーム項目数、が一般的な並びです。

まずヒートマップとスクロールマップで現状の課題を把握してください。スクロール深度が低いページ上部の変更は効果が出やすく、すでに読まれているページ下部の変更はインパクトが限定的です。

1回のテストで変える要素は原則1つにします。複数を同時に変えると、どの変更が効いたか特定できず、次の仮説が立てられません。

テストのバックログはスプレッドシートで管理し、仮説・対象要素・期待効果・優先度を記録します。チームで「次に何をテストするか」を議論するベースになります。

手順2：サンプルサイズとテスト期間を設計する

統計的有意性が確保されていない状態で判断すると、誤った結論を招きます。信頼水準95%・検出力80%を前提に、現状のCVRと期待する改善幅からサンプルサイズを逆算してください。

たとえばCVR 3%のページで0.5ptの改善を検出するには、バリアントあたり約5,000〜7,000セッションが必要です。

必要なサンプルサイズが確保できる期間をあらかじめ設定し、途中で「良さそう」という感覚だけでテストを止めないでください。途中終了は偽陽性(実際には差がないのに差があると誤判定する)リスクを高めます。

1週間未満のテストは、曜日効果を吸収できないため避けます。最低2週間・2,000セッション以上が目安です。トラフィックが少ないLPでは、テスト期間が4〜8週間になることもあります。

手順3：A/Bテストツールと計測を設定する

ツールは、VWO・Optimizely・AB TastyのようなテストツールかGA4+BigQueryを使った独自計測が主流です。小規模LPなら、URLパラメータで振り分けてGA4で比較する簡易手法も実用的です。

計測の核は、各バリアントへの露出(impression)と目標アクション(フォーム送信・購入完了)のイベントです。GA4ではカスタムイベントとコンバージョン設定を組み合わせて計測します。設定方法は「GA4でのLP計測設定ガイド」を参照してください。

HotjarやMicrosoft Clarityなどのヒートマップツールを並行導入すると、バリアント間のスクロール深度・クリック分布の違いが視覚的に分かり、結果の解釈精度が上がります。

テスト中は、キャンペーン時期・競合の大型施策・外部イベントがデータに影響することがあります。急激なトラフィック増減などの異常値は除外判断を検討し、結果レポートに外部環境のメモも残してください。

手順4：テスト結果を解釈して意思決定する

テスト終了後は、まず統計的有意差を確認します。p値<0.05(信頼水準95%)で有意差ありと判断するのが一般的です。

ただし、有意差があっても効果量が小さければ実装コストに見合わないことがあります。CVR改善幅の絶対値と、それが年間のCV数・収益にどう影響するかを合わせて評価してください。

負けたバリアントも次の仮説の材料です。なぜ悪化したかを仮説立てて次のテスト設計に反映すれば、チームの学習速度が上がります。失敗から学ぶカルチャーが、A/Bテストの継続に欠かせません。

勝者バリアントが確定したら、速やかに本番反映します。誰が承認し誰が実装するかのプロセスを事前に定め、スピード感を保つことが重要です。

手順5：要素別のA/Bテスト実践パターン4選

ヒーロー見出しのテスト：課題訴求型(「〇〇に悩んでいませんか」)とベネフィット訴求型(「〇〇が30%削減できる」)の比較は、多くのLPで高い改善効果が出やすい定番テストです。

CTAボタンのテスト：色・文言・サイズ・位置を変えます。「今すぐ申し込む」と「無料で試してみる」のような文言変更から始めると、実装コストが低く効果が出やすいです。

社会的証明のテスト：レビュー・導入社数・メディア掲載ロゴをCTA近くに置いた場合と中段に置いた場合の比較です。信頼要素の位置はBtoB LPで特に効果が出やすいテスト対象です。

フォームのテスト：項目数の削減(5項目→3項目)や展開式への変更です。採用LPやリード獲得型LPでは必ずテスト候補に入れてください。

A/Bテストの落とし穴5つと対策

落とし穴1：サンプルサイズ不足のまま判断する(ピーキング問題)。事前に期間とサンプル数を設定し、途中で変えないでください。

落とし穴2：複数の変更を同時にテストする。1テスト1仮説の原則を守ります。多変量テストには専用ツールと十分なトラフィックが必要です。

落とし穴3：季節・キャンペーン期間中にテストして結果が汚染される。通常期のトラフィックでテストし、異常値は除外判断します。

落とし穴4：CVR以外の指標を見ずに判断する。直帰率・スクロール深度・滞在時間などの補助指標も合わせて解釈してください。計測の全体設計は「GA4でのLP計測設定ガイド」で解説しています。

落とし穴5：勝者が出ても本番に反映しない。勝者確定から本番反映まで1週間以内のルールを決め、判断から実装までの流れをチームで合意しておきましょう。

組織にA/Bテスト文化を根付かせる方法

A/Bテストが機能する組織には共通点があります。テスト結果を個人の成否ではなくチームの学習として扱う文化、バックログを全員が参照できる透明性、「データが出るまで判断しない」という規律の3つです。

まずは小さく始め、月次の振り返り会でテスト結果を共有することから着手してください。

役割分担も明確にします。マーケターが仮説を立て、デザイナーがバリアントを作成し、エンジニアが計測と振り分けを実装する体制が、テストサイクルを短縮します。DesignLayerを使えば、デザイナーがバリアントLPを自力で作成し、エンジニアへの依頼を並行して進められます。

「月間テスト実施数」「累積CVR改善幅」などをチーム目標に設定すると定着が加速します。ただしテスト数だけを追うと質が下がるため、仮説の明確さと学習の共有を重視した評価基準を設けてください。

テスト結果は、仮説・変更内容・結果・学びを1ページにまとめて社内WikiやNotionに蓄積しましょう。新メンバーのオンボーディングや知見の再利用が容易になります。

DesignLayerでA/Bテスト用バリアントを作る

DesignLayerのスタジオでは、ヒーロー文言の書き換えやCTAコピーの変更を素早く行えます。A/Bテスト用のバリアントLPを短時間で複数作成し、エクスポートして開発への引き継ぎを並行して進められます。

テスト前の活用法としては、ブリーフで異なるコピーの方向性(課題訴求とベネフィット訴求など)を入力して2つのサイトを生成し、社内でプレビュー比較する方法が効果的です。方向性の感覚チェックを済ませてから本番テストに臨むと、テストの質が上がります。

A/Bテストは「正解を探す」のではなく「自社ユーザーへの理解を深める」プロセスです。結果を社内で共有し、次のLP企画・コピー・デザインに反映させる循環を作りましょう。LP設計の基礎は「ランディングページの構成テンプレート」も参照してください。