データ解析の何に時間がかかっているか? 障壁はなにか? Diary #03
みなさん、こんにちは。Vertysの山本です。
前回・前々回と、「製造業にはデータサイエンティストがいない」「自分でツールを作ろうと決めた」という話をしてきました。
でも「作ろう」と決意するのと、実際に作るのでは大違い。
まずは相手を知らなければいけません。
そもそも、製造業でのデータ解析って何がそんなに大変なのか?
どこに時間がかかっているのか?
今回は、改めてその「障壁」を整理してみたいと思います。
製造業での機械学習、今ある3つのアプローチ
製造業で機械学習やデータ解析に取り組もうとした場合、現実的には大きく3つのアプローチがあります。
| アプローチ | 内容 |
|---|---|
| A. 自力 | Python + scikit-learn などのOSSで自分たちで分析 |
| B. 市販ツール | 既製のデータ分析ソフトウェアを購入して利用 |
| C. コンサルティング | 外部の専門会社やSIerに依頼 |
どれも「あり」な選択肢に見えます。
でも現場の方に話を聞くと、どれもまあ、大変です。
A. 自力でやる ―「理想は高いが、時間がない」
Python + OSSは確かに無料です。学習リソースもネット上にたくさんある。
でも、冷静に考えてみてください。
- Pythonの習得に3〜6ヶ月
- 統計学の基礎にさらに3〜6ヶ月
- 製造ドメインへの応用にさらに6〜12ヶ月
合計で1〜2年です。
製造現場のエンジニアさんは、日々ラインを回しながら不良品対策や設備トラブルに追われています。
「今日からPythonの勉強を始めよう!」なんて言える余裕がある人は、正直ほとんどいません。
しかも、頑張って覚えても、できることは基本的な分析まで。
高度なモデルの構築や、設定値の最適化まで含めた一連のワークフローを自力で回すのは、かなりの上級者でないと厳しい。
リソースもスキルも、壁が高すぎる。
B. 市販ツールの場合 ―「高額で複雑」
じゃあ、既製品のツールを買えばいいんじゃないか。
確かに世の中にはデータ分析ツールがたくさんあります。
でも、製造業向けとなると――
- 高額:年間500万〜1,100万円クラスのものがゴロゴロ。中堅・中小企業にはとてもじゃないけど手が出ない
- 難易度が高い:ツール自体の操作に専門知識が必要。UIも英語圏のデータサイエンティスト向けに設計されていて、現場のエンジニアにはハードルが高い
- ツールの組み合わせが必要:データ前処理はこのツール、分析はこのツール、可視化はこのツール……と、いくつも組み合わせないと一連の分析ワークフローが完成しない
ひとつのツールで完結しないから、ツール間のデータの受け渡しにも手間がかかる。
結局、「ツールを使いこなすこと」自体が仕事になってしまう。
高額なのに、かゆいところに手が届かない。
C. コンサルティングの場合 ―「高い、そして手の内化できない」
最後の手段として、外部のコンサルに頼む方法もあります。
プロが分析してくれるので、結果は出ます。
でも――
- とにかく高額:一案件で数百万〜数千万円。繰り返し依頼すれば、あっという間に天文学的な金額に
- 手の内化ができない:コンサルが分析してくれるから、自社にノウハウが残らない。分析のブラックボックス化
- 依存構造から抜け出せない:次の課題が出てきたら、またコンサルに電話する。永遠にそのループ
これは「解決」じゃなくて「延命」です。
いつまで経っても自社でデータを活用する力がつきません。
……じゃあ、どうすればいいの?
ここまで書いて、ちょっと暗い気持ちになりますよね。すみません。
でも、こうやって整理してみると、理想のツール像が逆に浮かび上がってくるんです。
Aの裏返し → 専門知識がなくても使える。コーディング不要。
Bの裏返し → ローコストで導入できる。ひとつのツールで完結する。
Cの裏返し → 自分たちの手で分析できる。ノウハウが社内に残る。
まとめると、こうなります。
💭 ローコストで導入できて、
💭 専門家じゃなくても簡単に使えて、
💭 それでいて高度な分析もできて、
💭 データの前処理から分析・可視化までワンパッケージで、
💭 複数のツールを行ったり来たりせずワンストップで完結する。
「そんな都合のいいもの、あるわけないだろう」――そう思いますよね?
私も最初はそう思いました。
でも、「ないなら作ればいい」んです。
前回そう決意したんですから。
じゃあ、この理想を本当に形にできるのか? 何を作ればいいのか?
次回から、いよいよ具体的な開発ストーリーに入っていきたいと思います。お楽しみに。
この記事へのコメントはありません。