個人の生産性250%向上、チームのキャパシティは1.5倍へ。DMM.comがFindy Team+で解き明かす「AIの投資対効果」
個人の生産性250%向上、チームのキャパシティは1.5倍へ。DMM.comがFindy Team+で解き明かす「AIの投資対効果」

目次
目次を読み込み中...
サマリ
| AI活用の狙い |
・目標は開発全工程をAI前提で再構築する「AIネイティブ開発プロセス」 ・効果検証は人件費削減ではなく、事業目標を加速し採用計画を最適化するための判断材料。 |
| AIツールの投資対効果の計測方法 |
・プルリク分析:AI生成か人間による作成かをタグ付けし、処理量およびレビュー所要時間を自動で集計。Devin AIが1日に作成するプルリク数を、人間が作成する量・質・所要時間と比較して評価。 ・タスク完了予実:Jira 連携でストーリーポイント消化速度をトラッキングし、Findy Team+ダッシュボードで AI 対象タスクをフィルタリング。 ・オンボーディング指標:新規参画者が初回プルリクエストを出すまでの平均日数を計測。 |
| 定量的成果 |
・チームキャパシティ平均1.5倍、個人生産性が最大2.5倍。 ・タスクによっては10日→1時間へ短縮。「数字を見る文化」が醸成され、データドリブンな改善サイクルが定着。 |
| 開発者体験の向上 |
・AIが壁打ち役となり、新規参画者のオンボーディングがスムーズに。 ・心理的安全性も向上。 |
| 顕在化した課題 |
・レビュー負荷増大による「AI疲れ」 ・エンジニア職能が「コードを書く」から「AI生成コードの妥当性を判定・レビュー」に移行し、深いドメイン知識が必須に。 |
| 今後の展望 |
・すべてのドキュメントをコードとして管理する「Docs as Code」を推進し、要件定義~実装のサイクルを自動化。 ・Findy Team+でROIとプロセス最適化を継続的にモニタリング予定。 |
多くの企業が生成AI(ChatGPT、Copilotなど)の導入が加速する一方で、プルリクエストやドキュメントの爆発的増加、レビュー滞留、判断記録の欠落といった “見えない問題”が開発現場を覆い始めています。
原因は AIそのものではなく、効果を数値で確認できる可視化基盤の不足です。Findy Team+はそのギャップを埋め、AI活用の投資対効果を客観的に証明します。
本記事では、開発速度の向上と技術負債の解消を目的にAIツールを導入し、その投資対効果(ROI)をFindy Team+で定量的に検証している合同会社DMM.comプラットフォーム開発本部の取り組みを紹介します。
合同会社DMM.comプラットフォーム開発本部について教えてください。
合同会社DMM.comは、1998年の創業以来、動画配信や電子書籍、アニメなどの多様なエンタメサービスに加え、3DプリントやEV充電などのハードウェア分野、AIといった最先端のテクノロジーを取り入れた事業など、60以上の多様な事業を領域問わず展開しています。
創業から25年以上が経過し、事業の成長とともにシステムは複雑化しており、競合他社に打ち勝つための開発スピード向上や、積み重なった技術的負債への対応が常に課題としてありました。
こうした背景から、既存システムの改修や新規開発の効率を抜本的に改善する手段として、AI技術の活用に大きな期待を寄せていました。
AIツールの活用目的や目標について教えてください。
我々が目指しているのは、単にAIをツールとして部分的に使うのではなく、開発の全工程がAIの存在を前提とした「AIネイティブな開発プロセス」を構築することです。
まずは、AIが得意とする既存コードの読解能力を活かして、長年の課題であった技術負債の解消や、新規参画メンバーのオンボーディングを円滑化することを目標に掲げました。
エンジニアが既存の複雑な仕様調査に時間を費やすフラストレーションを軽減し、いつでも相談できるAIが隣にいることで、心理的な安全性も高まると期待しています。
将来的には、コーディングだけでなく、要件定義から設計、テストに至る開発サイクル全体にAIを深く組み込み、人間はより創造性が求められる高度な判断に集中できる組織体制を理想としています。
なぜAIツールの効果検証を行おうと思われたのでしょうか?
AIは開発リソースの一部ですが、同時にライセンス費用が発生するSaaSツールでもあります。他のツールを導入する際と同様に、費用対効果を明確にする必要があると考えたのが直接のきっかけです。
一方で、「人の採用における投資対効果は厳密に見ていないのに、なぜAIだけを問うのか」という自問もありました。ただ、まずはツールとしての効果を定量的に示すことが、全社的な活用推進に不可欠だと判断しました。
目的は、単純な人件費削減ではありません。例えばAI活用で生産性が向上した分、人を減らすのではなく、「本来1年かかっていた事業目標を半年で達成する」といった事業スピードの加速に繋げたい。そのための投資だと捉えています。
ですから、AI導入の投資対効果を正確に把握することは、採用計画の最適化や、より戦略的なリソース配分を行うための重要な判断材料になるのです。
AIツールの定量化・可視化をすることのメリットをどう捉えていらっしゃいますか?
最大のメリットは、開発チームに「数字を見る文化」が根付き始めたことですね。
実は、Findy Team+はAIを導入する以前から利用しており、Four Keysなどの指標を可視化する試みは行っていました。
しかし当時は、日々の改善活動と数値の変化がすぐには結びつかず、文化として浸透させるまでには至っていなかったのが正直なところです。
ところが、AIを導入したことで状況は一変しました。
AIエージェントがプルリクエストをどんどん作ってくれるので、Findy Team+上のメトリクスが目に見えて、しかも劇的に変化したんです。
自分たちの取り組みが数値にダイレクトに反映される「楽しさ」をチームが実感し、データに基づいた開発生産性への関心が格段に高まりました。
漠然とした「速くなった」という体感が、Findy Team+によって具体的な事実として共有され、次の改善アクションに繋がるという好循環が生まれています。
具体的な効果・変化はありましたか?
AIの効果検証を通じて、まず開発プロセスそのものが大きく変化しました。特に開発フェーズでは、自然言語でAIに指示を出すペアコーディングのようなスタイルが主流になりつつあります。
また、これまでなかなか進まなかった既存コードのリファクタリングも、技術負債を検知・修正提案するAIエージェントの力を借りることで、積極的に推進できるようになりました。
定量的な効果は非常に明確です。
Findy Team+で個人のアクティビティを分析すると、タスクによっては「これまで10日かかると見積もっていた作業が1時間で完了した」という驚くような事例も出ています。
チーム全体のキャパシティ(開発可能なタスク量)で見ても、導入前後で平均して1.5倍、特にAI活用が進んでいるチームでは2.5倍にまで向上していることが確認できています。
【Findy Team+でDevin AIを効果検証・人間チーム vs Devin AI 総合比較】
基本統計(2025年3月〜6月19日)
| 項目 | 人間チーム | Devin AI | 比率 |
|---|---|---|---|
| 総PR数 | 189件 | 74件 | 2.6:1 |
| 全体に占める割合 | 71.9% | 28.1% | ー |
| 開発者数 | 12名 | 1体 | ー |
| 日平均PR | 1.7件/日 | 0.67件/日 | 2.5:1 |
| 1人あたり平均 | 15.8件 | 74件 | 1:4.7 |

詳細パフォーマンス指標
【生産性分析】
| 指標 | 人間チーム | Devin AI | 勝者 |
|---|---|---|---|
| 総合生産量 | 189件 | 74件 | 人間チーム |
| 個別生産性 | 15.8件/人 | 74件 | Devin AI |
| 継続性 | 不規則 | 111日中74日活動 | Devin AI |
| ピーク生産 | 3件/日 (最大) | 9件/日 (最大) | Devin AI |
【品質指標】
| 指標 | 人間チーム | Devin AI | 勝者 |
|---|---|---|---|
| マージ率 | 85-90% | 60.1% | 人間チーム |
| レビュー品質 | 自己完結型 | 要人間確認 | 人間チーム |
| 複雑度対応 | 高度な設計可能 | 定型作業のみ | 人間チーム |
| エラー率 | 10-15% | 40% | 人間チーム |
【作業内容比較】
| 人間チーム (189件) の作業分布 | |
|---|---|
| 新機能開発 | 40% (76件) |
| バグ修正・改善 | 30% (57件) |
| テスト実装 | 20% (38件) |
| 保守・リファクタ | 10% (18件) |
| Devin AI (74件) の作業分布 | |
|---|---|
| コード変換 | 60% (44件) – Kotlin-Java |
| テスト変換 | 30% (22件) |
| 機能改善 | 10% (8件) |
【月別推移分析】
| 月 | 人間チーム | Devin AI | 人間優位度 |
|---|---|---|---|
| 3月 | ~50件 | 10件 | 5:1 |
| 4月 | ~65件 | 25件 | 2.6:1 |
| 5月 | ~55件 | 26件 | 2.1:1 |
| 6月 | ~19件 | 13件 | 1.5:1 |
【戦略的価値分析】
ROI (投資対効果)
| 項目 | 人間チーム | Devin AI |
|---|---|---|
| コスト | 高 (12名の人件費) | 低 (AI利用料のみ) |
| 価値 | 創造的・戦略的価値 | 定型作業の大量処理 |
| 効率 | 安定した品質 | 圧倒的な処理速度 |
【相補効果分析】
- 従来:人間12名 = 189件 (100%)
- 現在:人間12名 + Devin AI = 263件 (139%)
「生産性向上:+39% のチーム効率アップ!」
【総合評価】
| 人間チームの優位性 | |
|---|---|
| 品質 | 85-90%の高いマージ率 |
| 創造性 | 新機能・アーキテクチャ設計 |
| 柔軟性 | 複雑な問題への対応力 |
| 自立性 | レビュー・判断の独立性 |
| Devin AI | |
|---|---|
| 量 | 1人で12人分の1/4を処理 |
| 継続性 | 安定した毎日稼働 |
| コスト | 人件費の大幅削減 |
| 定型作業 | 反復作業の圧倒的効率 |
※プラットフォーム開発本部ユーザーレビューグループ 松井氏(https://x.com/matsui_tk)よりFindy AI+にて作成。
また、開発者体験という面では、特にオンボーディングの質が大きく向上したと感じています。
これまでは不明点があると先輩エンジニアに聞くしかなく、作業が止まってしまうこともありました。
今ではAIがいつでも壁打ち相手になってくれるため、新規参画メンバーが孤独を感じにくくなり、組織全体の心理的安全性の向上にも繋がっているというポジティブな声が実際に聞かれます。
効果検証を通じて見えてきた、AIツールのデメリットや課題はありますか?
はい、もちろんです。光の側面だけでなく、新たな課題も見えてきました。最も顕著なのが「AI疲れ」と「レビュー負荷の増大」です。
AIが非同期で大量のプルリクエストを生成するため、人間のレビュー能力が追いつかず、結果的に全体のリードタイムが長くなるという本末転倒な事態も発生しました。
これは、スピードを重視するあまり、品質が犠牲になる典型的な例です。
この対策として、現在はチーム内でプロンプトエンジニアリングの知見を共有したり、特定の品質チェックツールをCIに組み込んで、人間が見る前にAIが品質のガードレール役を担うようにしたりと、仕組みでの解決を図っています。
こうした変化は、エンジニアの役割そのものにも影響を与えています。
AIの発展により、エンジニアの仕事は「コードを書く人」から「AIが生成したコードの正しさを、ビジネスドメインやシステム全体の文脈で判断・レビューする人」へと明確にシフトしていくでしょう。
つまり、自分でコードは書かなくても、システムの深い知識はこれまで以上に求められる。
この、ある種の矛盾したスキルセットをどう育てていくかが、今後の組織的な課題だと考えています。
今後の展望・期待を教えてください
今後は、開発フェーズだけでなく、より上流のプロセスからAIを組み込む取り組みを進めていきます。
その中核となるのが、仕様書や設計書といった全てのドキュメントをGitでコードとして管理する「Docs as Code」の構想です。
あらゆるドキュメントをAIが読みやすい状態にすることで、例えばPRD(製品要求仕様書)が作成されたら、半自動で設計書や実装コードの雛形が生成されるような、開発サイクル全体の自動化を目指しています。
この構想を実現する上で、Findy Team+には大きな期待を寄せています。
最後に
AIを前提とした開発体制への変革は、AIツールをただ導入するだけでは終わることはありません。
導入したAIツールがどのように活用され、開発組織にどのような影響をもたらしたのかを定量的に測定することが重要です。
また、AIの導入効果を測定することは、社内での投資対効果を示す材料として必要不可欠な情報となります。
あなたの組織では、AI活用に対して定量的に測ることができていますか?
サマリ
| AI活用の狙い |
・目標は開発全工程をAI前提で再構築する「AIネイティブ開発プロセス」 ・効果検証は人件費削減ではなく、事業目標を加速し採用計画を最適化するための判断材料。 |
| AIツールの投資対効果の計測方法 |
・プルリク分析:AI生成か人間による作成かをタグ付けし、処理量およびレビュー所要時間を自動で集計。Devin AIが1日に作成するプルリク数を、人間が作成する量・質・所要時間と比較して評価。 ・タスク完了予実:Jira 連携でストーリーポイント消化速度をトラッキングし、Findy Team+ダッシュボードで AI 対象タスクをフィルタリング。 ・オンボーディング指標:新規参画者が初回プルリクエストを出すまでの平均日数を計測。 |
| 定量的成果 |
・チームキャパシティ平均1.5倍、個人生産性が最大2.5倍。 ・タスクによっては10日→1時間へ短縮。「数字を見る文化」が醸成され、データドリブンな改善サイクルが定着。 |
| 開発者体験の向上 |
・AIが壁打ち役となり、新規参画者のオンボーディングがスムーズに。 ・心理的安全性も向上。 |
| 顕在化した課題 |
・レビュー負荷増大による「AI疲れ」 ・エンジニア職能が「コードを書く」から「AI生成コードの妥当性を判定・レビュー」に移行し、深いドメイン知識が必須に。 |
| 今後の展望 |
・すべてのドキュメントをコードとして管理する「Docs as Code」を推進し、要件定義~実装のサイクルを自動化。 ・Findy Team+でROIとプロセス最適化を継続的にモニタリング予定。 |
多くの企業が生成AI(ChatGPT、Copilotなど)の導入が加速する一方で、プルリクエストやドキュメントの爆発的増加、レビュー滞留、判断記録の欠落といった “見えない問題”が開発現場を覆い始めています。
原因は AIそのものではなく、効果を数値で確認できる可視化基盤の不足です。Findy Team+はそのギャップを埋め、AI活用の投資対効果を客観的に証明します。
本記事では、開発速度の向上と技術負債の解消を目的にAIツールを導入し、その投資対効果(ROI)をFindy Team+で定量的に検証している合同会社DMM.comプラットフォーム開発本部の取り組みを紹介します。
合同会社DMM.comプラットフォーム開発本部について教えてください。
合同会社DMM.comは、1998年の創業以来、動画配信や電子書籍、アニメなどの多様なエンタメサービスに加え、3DプリントやEV充電などのハードウェア分野、AIといった最先端のテクノロジーを取り入れた事業など、60以上の多様な事業を領域問わず展開しています。
創業から25年以上が経過し、事業の成長とともにシステムは複雑化しており、競合他社に打ち勝つための開発スピード向上や、積み重なった技術的負債への対応が常に課題としてありました。
こうした背景から、既存システムの改修や新規開発の効率を抜本的に改善する手段として、AI技術の活用に大きな期待を寄せていました。
AIツールの活用目的や目標について教えてください。
我々が目指しているのは、単にAIをツールとして部分的に使うのではなく、開発の全工程がAIの存在を前提とした「AIネイティブな開発プロセス」を構築することです。
まずは、AIが得意とする既存コードの読解能力を活かして、長年の課題であった技術負債の解消や、新規参画メンバーのオンボーディングを円滑化することを目標に掲げました。
エンジニアが既存の複雑な仕様調査に時間を費やすフラストレーションを軽減し、いつでも相談できるAIが隣にいることで、心理的な安全性も高まると期待しています。
将来的には、コーディングだけでなく、要件定義から設計、テストに至る開発サイクル全体にAIを深く組み込み、人間はより創造性が求められる高度な判断に集中できる組織体制を理想としています。
なぜAIツールの効果検証を行おうと思われたのでしょうか?
AIは開発リソースの一部ですが、同時にライセンス費用が発生するSaaSツールでもあります。他のツールを導入する際と同様に、費用対効果を明確にする必要があると考えたのが直接のきっかけです。
一方で、「人の採用における投資対効果は厳密に見ていないのに、なぜAIだけを問うのか」という自問もありました。ただ、まずはツールとしての効果を定量的に示すことが、全社的な活用推進に不可欠だと判断しました。
目的は、単純な人件費削減ではありません。例えばAI活用で生産性が向上した分、人を減らすのではなく、「本来1年かかっていた事業目標を半年で達成する」といった事業スピードの加速に繋げたい。そのための投資だと捉えています。
ですから、AI導入の投資対効果を正確に把握することは、採用計画の最適化や、より戦略的なリソース配分を行うための重要な判断材料になるのです。
AIツールの定量化・可視化をすることのメリットをどう捉えていらっしゃいますか?
最大のメリットは、開発チームに「数字を見る文化」が根付き始めたことですね。
実は、Findy Team+はAIを導入する以前から利用しており、Four Keysなどの指標を可視化する試みは行っていました。
しかし当時は、日々の改善活動と数値の変化がすぐには結びつかず、文化として浸透させるまでには至っていなかったのが正直なところです。
ところが、AIを導入したことで状況は一変しました。
AIエージェントがプルリクエストをどんどん作ってくれるので、Findy Team+上のメトリクスが目に見えて、しかも劇的に変化したんです。
自分たちの取り組みが数値にダイレクトに反映される「楽しさ」をチームが実感し、データに基づいた開発生産性への関心が格段に高まりました。
漠然とした「速くなった」という体感が、Findy Team+によって具体的な事実として共有され、次の改善アクションに繋がるという好循環が生まれています。
具体的な効果・変化はありましたか?
AIの効果検証を通じて、まず開発プロセスそのものが大きく変化しました。特に開発フェーズでは、自然言語でAIに指示を出すペアコーディングのようなスタイルが主流になりつつあります。
また、これまでなかなか進まなかった既存コードのリファクタリングも、技術負債を検知・修正提案するAIエージェントの力を借りることで、積極的に推進できるようになりました。
定量的な効果は非常に明確です。
Findy Team+で個人のアクティビティを分析すると、タスクによっては「これまで10日かかると見積もっていた作業が1時間で完了した」という驚くような事例も出ています。
チーム全体のキャパシティ(開発可能なタスク量)で見ても、導入前後で平均して1.5倍、特にAI活用が進んでいるチームでは2.5倍にまで向上していることが確認できています。
【Findy Team+でDevin AIを効果検証・人間チーム vs Devin AI 総合比較】
基本統計(2025年3月〜6月19日)
| 項目 | 人間チーム | Devin AI | 比率 |
|---|---|---|---|
| 総PR数 | 189件 | 74件 | 2.6:1 |
| 全体に占める割合 | 71.9% | 28.1% | ー |
| 開発者数 | 12名 | 1体 | ー |
| 日平均PR | 1.7件/日 | 0.67件/日 | 2.5:1 |
| 1人あたり平均 | 15.8件 | 74件 | 1:4.7 |

詳細パフォーマンス指標
【生産性分析】
| 指標 | 人間チーム | Devin AI | 勝者 |
|---|---|---|---|
| 総合生産量 | 189件 | 74件 | 人間チーム |
| 個別生産性 | 15.8件/人 | 74件 | Devin AI |
| 継続性 | 不規則 | 111日中74日活動 | Devin AI |
| ピーク生産 | 3件/日 (最大) | 9件/日 (最大) | Devin AI |
【品質指標】
| 指標 | 人間チーム | Devin AI | 勝者 |
|---|---|---|---|
| マージ率 | 85-90% | 60.1% | 人間チーム |
| レビュー品質 | 自己完結型 | 要人間確認 | 人間チーム |
| 複雑度対応 | 高度な設計可能 | 定型作業のみ | 人間チーム |
| エラー率 | 10-15% | 40% | 人間チーム |
【作業内容比較】
| 人間チーム (189件) の作業分布 | |
|---|---|
| 新機能開発 | 40% (76件) |
| バグ修正・改善 | 30% (57件) |
| テスト実装 | 20% (38件) |
| 保守・リファクタ | 10% (18件) |
| Devin AI (74件) の作業分布 | |
|---|---|
| コード変換 | 60% (44件) – Kotlin-Java |
| テスト変換 | 30% (22件) |
| 機能改善 | 10% (8件) |
【月別推移分析】
| 月 | 人間チーム | Devin AI | 人間優位度 |
|---|---|---|---|
| 3月 | ~50件 | 10件 | 5:1 |
| 4月 | ~65件 | 25件 | 2.6:1 |
| 5月 | ~55件 | 26件 | 2.1:1 |
| 6月 | ~19件 | 13件 | 1.5:1 |
【戦略的価値分析】
ROI (投資対効果)
| 項目 | 人間チーム | Devin AI |
|---|---|---|
| コスト | 高 (12名の人件費) | 低 (AI利用料のみ) |
| 価値 | 創造的・戦略的価値 | 定型作業の大量処理 |
| 効率 | 安定した品質 | 圧倒的な処理速度 |
【相補効果分析】
- 従来:人間12名 = 189件 (100%)
- 現在:人間12名 + Devin AI = 263件 (139%)
「生産性向上:+39% のチーム効率アップ!」
【総合評価】
| 人間チームの優位性 | |
|---|---|
| 品質 | 85-90%の高いマージ率 |
| 創造性 | 新機能・アーキテクチャ設計 |
| 柔軟性 | 複雑な問題への対応力 |
| 自立性 | レビュー・判断の独立性 |
| Devin AI | |
|---|---|
| 量 | 1人で12人分の1/4を処理 |
| 継続性 | 安定した毎日稼働 |
| コスト | 人件費の大幅削減 |
| 定型作業 | 反復作業の圧倒的効率 |
※プラットフォーム開発本部ユーザーレビューグループ 松井氏(https://x.com/matsui_tk)よりFindy AI+にて作成。
また、開発者体験という面では、特にオンボーディングの質が大きく向上したと感じています。
これまでは不明点があると先輩エンジニアに聞くしかなく、作業が止まってしまうこともありました。
今ではAIがいつでも壁打ち相手になってくれるため、新規参画メンバーが孤独を感じにくくなり、組織全体の心理的安全性の向上にも繋がっているというポジティブな声が実際に聞かれます。
効果検証を通じて見えてきた、AIツールのデメリットや課題はありますか?
はい、もちろんです。光の側面だけでなく、新たな課題も見えてきました。最も顕著なのが「AI疲れ」と「レビュー負荷の増大」です。
AIが非同期で大量のプルリクエストを生成するため、人間のレビュー能力が追いつかず、結果的に全体のリードタイムが長くなるという本末転倒な事態も発生しました。
これは、スピードを重視するあまり、品質が犠牲になる典型的な例です。
この対策として、現在はチーム内でプロンプトエンジニアリングの知見を共有したり、特定の品質チェックツールをCIに組み込んで、人間が見る前にAIが品質のガードレール役を担うようにしたりと、仕組みでの解決を図っています。
こうした変化は、エンジニアの役割そのものにも影響を与えています。
AIの発展により、エンジニアの仕事は「コードを書く人」から「AIが生成したコードの正しさを、ビジネスドメインやシステム全体の文脈で判断・レビューする人」へと明確にシフトしていくでしょう。
つまり、自分でコードは書かなくても、システムの深い知識はこれまで以上に求められる。
この、ある種の矛盾したスキルセットをどう育てていくかが、今後の組織的な課題だと考えています。
今後の展望・期待を教えてください
今後は、開発フェーズだけでなく、より上流のプロセスからAIを組み込む取り組みを進めていきます。
その中核となるのが、仕様書や設計書といった全てのドキュメントをGitでコードとして管理する「Docs as Code」の構想です。
あらゆるドキュメントをAIが読みやすい状態にすることで、例えばPRD(製品要求仕様書)が作成されたら、半自動で設計書や実装コードの雛形が生成されるような、開発サイクル全体の自動化を目指しています。
この構想を実現する上で、Findy Team+には大きな期待を寄せています。
最後に
AIを前提とした開発体制への変革は、AIツールをただ導入するだけでは終わることはありません。
導入したAIツールがどのように活用され、開発組織にどのような影響をもたらしたのかを定量的に測定することが重要です。
また、AIの導入効果を測定することは、社内での投資対効果を示す材料として必要不可欠な情報となります。
あなたの組織では、AI活用に対して定量的に測ることができていますか?
個人の生産性250%向上、チームのキャパシティは1.5倍へ。DMM.comがFindy Team+で解き明かす「AIの投資対効果」

サマリ
| AI活用の狙い |
・目標は開発全工程をAI前提で再構築する「AIネイティブ開発プロセス」 ・効果検証は人件費削減ではなく、事業目標を加速し採用計画を最適化するための判断材料。 |
| AIツールの投資対効果の計測方法 |
・プルリク分析:AI生成か人間による作成かをタグ付けし、処理量およびレビュー所要時間を自動で集計。Devin AIが1日に作成するプルリク数を、人間が作成する量・質・所要時間と比較して評価。 ・タスク完了予実:Jira 連携でストーリーポイント消化速度をトラッキングし、Findy Team+ダッシュボードで AI 対象タスクをフィルタリング。 ・オンボーディング指標:新規参画者が初回プルリクエストを出すまでの平均日数を計測。 |
| 定量的成果 |
・チームキャパシティ平均1.5倍、個人生産性が最大2.5倍。 ・タスクによっては10日→1時間へ短縮。「数字を見る文化」が醸成され、データドリブンな改善サイクルが定着。 |
| 開発者体験の向上 |
・AIが壁打ち役となり、新規参画者のオンボーディングがスムーズに。 ・心理的安全性も向上。 |
| 顕在化した課題 |
・レビュー負荷増大による「AI疲れ」 ・エンジニア職能が「コードを書く」から「AI生成コードの妥当性を判定・レビュー」に移行し、深いドメイン知識が必須に。 |
| 今後の展望 |
・すべてのドキュメントをコードとして管理する「Docs as Code」を推進し、要件定義~実装のサイクルを自動化。 ・Findy Team+でROIとプロセス最適化を継続的にモニタリング予定。 |
多くの企業が生成AI(ChatGPT、Copilotなど)の導入が加速する一方で、プルリクエストやドキュメントの爆発的増加、レビュー滞留、判断記録の欠落といった “見えない問題”が開発現場を覆い始めています。
原因は AIそのものではなく、効果を数値で確認できる可視化基盤の不足です。Findy Team+はそのギャップを埋め、AI活用の投資対効果を客観的に証明します。
本記事では、開発速度の向上と技術負債の解消を目的にAIツールを導入し、その投資対効果(ROI)をFindy Team+で定量的に検証している合同会社DMM.comプラットフォーム開発本部の取り組みを紹介します。
合同会社DMM.comプラットフォーム開発本部について教えてください。
合同会社DMM.comは、1998年の創業以来、動画配信や電子書籍、アニメなどの多様なエンタメサービスに加え、3DプリントやEV充電などのハードウェア分野、AIといった最先端のテクノロジーを取り入れた事業など、60以上の多様な事業を領域問わず展開しています。
創業から25年以上が経過し、事業の成長とともにシステムは複雑化しており、競合他社に打ち勝つための開発スピード向上や、積み重なった技術的負債への対応が常に課題としてありました。
こうした背景から、既存システムの改修や新規開発の効率を抜本的に改善する手段として、AI技術の活用に大きな期待を寄せていました。
AIツールの活用目的や目標について教えてください。
我々が目指しているのは、単にAIをツールとして部分的に使うのではなく、開発の全工程がAIの存在を前提とした「AIネイティブな開発プロセス」を構築することです。
まずは、AIが得意とする既存コードの読解能力を活かして、長年の課題であった技術負債の解消や、新規参画メンバーのオンボーディングを円滑化することを目標に掲げました。
エンジニアが既存の複雑な仕様調査に時間を費やすフラストレーションを軽減し、いつでも相談できるAIが隣にいることで、心理的な安全性も高まると期待しています。
将来的には、コーディングだけでなく、要件定義から設計、テストに至る開発サイクル全体にAIを深く組み込み、人間はより創造性が求められる高度な判断に集中できる組織体制を理想としています。
なぜAIツールの効果検証を行おうと思われたのでしょうか?
AIは開発リソースの一部ですが、同時にライセンス費用が発生するSaaSツールでもあります。他のツールを導入する際と同様に、費用対効果を明確にする必要があると考えたのが直接のきっかけです。
一方で、「人の採用における投資対効果は厳密に見ていないのに、なぜAIだけを問うのか」という自問もありました。ただ、まずはツールとしての効果を定量的に示すことが、全社的な活用推進に不可欠だと判断しました。
目的は、単純な人件費削減ではありません。例えばAI活用で生産性が向上した分、人を減らすのではなく、「本来1年かかっていた事業目標を半年で達成する」といった事業スピードの加速に繋げたい。そのための投資だと捉えています。
ですから、AI導入の投資対効果を正確に把握することは、採用計画の最適化や、より戦略的なリソース配分を行うための重要な判断材料になるのです。
AIツールの定量化・可視化をすることのメリットをどう捉えていらっしゃいますか?
最大のメリットは、開発チームに「数字を見る文化」が根付き始めたことですね。
実は、Findy Team+はAIを導入する以前から利用しており、Four Keysなどの指標を可視化する試みは行っていました。
しかし当時は、日々の改善活動と数値の変化がすぐには結びつかず、文化として浸透させるまでには至っていなかったのが正直なところです。
ところが、AIを導入したことで状況は一変しました。
AIエージェントがプルリクエストをどんどん作ってくれるので、Findy Team+上のメトリクスが目に見えて、しかも劇的に変化したんです。
自分たちの取り組みが数値にダイレクトに反映される「楽しさ」をチームが実感し、データに基づいた開発生産性への関心が格段に高まりました。
漠然とした「速くなった」という体感が、Findy Team+によって具体的な事実として共有され、次の改善アクションに繋がるという好循環が生まれています。
具体的な効果・変化はありましたか?
AIの効果検証を通じて、まず開発プロセスそのものが大きく変化しました。特に開発フェーズでは、自然言語でAIに指示を出すペアコーディングのようなスタイルが主流になりつつあります。
また、これまでなかなか進まなかった既存コードのリファクタリングも、技術負債を検知・修正提案するAIエージェントの力を借りることで、積極的に推進できるようになりました。
定量的な効果は非常に明確です。
Findy Team+で個人のアクティビティを分析すると、タスクによっては「これまで10日かかると見積もっていた作業が1時間で完了した」という驚くような事例も出ています。
チーム全体のキャパシティ(開発可能なタスク量)で見ても、導入前後で平均して1.5倍、特にAI活用が進んでいるチームでは2.5倍にまで向上していることが確認できています。
【Findy Team+でDevin AIを効果検証・人間チーム vs Devin AI 総合比較】
基本統計(2025年3月〜6月19日)
| 項目 | 人間チーム | Devin AI | 比率 |
|---|---|---|---|
| 総PR数 | 189件 | 74件 | 2.6:1 |
| 全体に占める割合 | 71.9% | 28.1% | ー |
| 開発者数 | 12名 | 1体 | ー |
| 日平均PR | 1.7件/日 | 0.67件/日 | 2.5:1 |
| 1人あたり平均 | 15.8件 | 74件 | 1:4.7 |

詳細パフォーマンス指標
【生産性分析】
| 指標 | 人間チーム | Devin AI | 勝者 |
|---|---|---|---|
| 総合生産量 | 189件 | 74件 | 人間チーム |
| 個別生産性 | 15.8件/人 | 74件 | Devin AI |
| 継続性 | 不規則 | 111日中74日活動 | Devin AI |
| ピーク生産 | 3件/日 (最大) | 9件/日 (最大) | Devin AI |
【品質指標】
| 指標 | 人間チーム | Devin AI | 勝者 |
|---|---|---|---|
| マージ率 | 85-90% | 60.1% | 人間チーム |
| レビュー品質 | 自己完結型 | 要人間確認 | 人間チーム |
| 複雑度対応 | 高度な設計可能 | 定型作業のみ | 人間チーム |
| エラー率 | 10-15% | 40% | 人間チーム |
【作業内容比較】
| 人間チーム (189件) の作業分布 | |
|---|---|
| 新機能開発 | 40% (76件) |
| バグ修正・改善 | 30% (57件) |
| テスト実装 | 20% (38件) |
| 保守・リファクタ | 10% (18件) |
| Devin AI (74件) の作業分布 | |
|---|---|
| コード変換 | 60% (44件) – Kotlin-Java |
| テスト変換 | 30% (22件) |
| 機能改善 | 10% (8件) |
【月別推移分析】
| 月 | 人間チーム | Devin AI | 人間優位度 |
|---|---|---|---|
| 3月 | ~50件 | 10件 | 5:1 |
| 4月 | ~65件 | 25件 | 2.6:1 |
| 5月 | ~55件 | 26件 | 2.1:1 |
| 6月 | ~19件 | 13件 | 1.5:1 |
【戦略的価値分析】
ROI (投資対効果)
| 項目 | 人間チーム | Devin AI |
|---|---|---|
| コスト | 高 (12名の人件費) | 低 (AI利用料のみ) |
| 価値 | 創造的・戦略的価値 | 定型作業の大量処理 |
| 効率 | 安定した品質 | 圧倒的な処理速度 |
【相補効果分析】
- 従来:人間12名 = 189件 (100%)
- 現在:人間12名 + Devin AI = 263件 (139%)
「生産性向上:+39% のチーム効率アップ!」
【総合評価】
| 人間チームの優位性 | |
|---|---|
| 品質 | 85-90%の高いマージ率 |
| 創造性 | 新機能・アーキテクチャ設計 |
| 柔軟性 | 複雑な問題への対応力 |
| 自立性 | レビュー・判断の独立性 |
| Devin AI | |
|---|---|
| 量 | 1人で12人分の1/4を処理 |
| 継続性 | 安定した毎日稼働 |
| コスト | 人件費の大幅削減 |
| 定型作業 | 反復作業の圧倒的効率 |
※プラットフォーム開発本部ユーザーレビューグループ 松井氏(https://x.com/matsui_tk)よりFindy AI+にて作成。
また、開発者体験という面では、特にオンボーディングの質が大きく向上したと感じています。
これまでは不明点があると先輩エンジニアに聞くしかなく、作業が止まってしまうこともありました。
今ではAIがいつでも壁打ち相手になってくれるため、新規参画メンバーが孤独を感じにくくなり、組織全体の心理的安全性の向上にも繋がっているというポジティブな声が実際に聞かれます。
効果検証を通じて見えてきた、AIツールのデメリットや課題はありますか?
はい、もちろんです。光の側面だけでなく、新たな課題も見えてきました。最も顕著なのが「AI疲れ」と「レビュー負荷の増大」です。
AIが非同期で大量のプルリクエストを生成するため、人間のレビュー能力が追いつかず、結果的に全体のリードタイムが長くなるという本末転倒な事態も発生しました。
これは、スピードを重視するあまり、品質が犠牲になる典型的な例です。
この対策として、現在はチーム内でプロンプトエンジニアリングの知見を共有したり、特定の品質チェックツールをCIに組み込んで、人間が見る前にAIが品質のガードレール役を担うようにしたりと、仕組みでの解決を図っています。
こうした変化は、エンジニアの役割そのものにも影響を与えています。
AIの発展により、エンジニアの仕事は「コードを書く人」から「AIが生成したコードの正しさを、ビジネスドメインやシステム全体の文脈で判断・レビューする人」へと明確にシフトしていくでしょう。
つまり、自分でコードは書かなくても、システムの深い知識はこれまで以上に求められる。
この、ある種の矛盾したスキルセットをどう育てていくかが、今後の組織的な課題だと考えています。
今後の展望・期待を教えてください
今後は、開発フェーズだけでなく、より上流のプロセスからAIを組み込む取り組みを進めていきます。
その中核となるのが、仕様書や設計書といった全てのドキュメントをGitでコードとして管理する「Docs as Code」の構想です。
あらゆるドキュメントをAIが読みやすい状態にすることで、例えばPRD(製品要求仕様書)が作成されたら、半自動で設計書や実装コードの雛形が生成されるような、開発サイクル全体の自動化を目指しています。
この構想を実現する上で、Findy Team+には大きな期待を寄せています。
最後に
AIを前提とした開発体制への変革は、AIツールをただ導入するだけでは終わることはありません。
導入したAIツールがどのように活用され、開発組織にどのような影響をもたらしたのかを定量的に測定することが重要です。
また、AIの導入効果を測定することは、社内での投資対効果を示す材料として必要不可欠な情報となります。
あなたの組織では、AI活用に対して定量的に測ることができていますか?






