
求人票の肩書きは立派。でも入ってみたら「集計と資料づくりが9割」…
半年後にきちんと成果と成長が残る会社だけを見極めたい…!
本記事はデータ職(データサイエンティスト/アナリスト/MLエンジニア)志望の方向けに、求人票の“文章”から実務度を読み解くための実践ガイドです。
5観点×45項目のチェックリスト、スコアリング表、面談での定量質問テンプレ、レッド/グリーンフラグ集、オファー比較表まで、すべてコピペ活用OKでまとめました。
この記事でわかること
-
求人票の文章から“実務度”を数値化する方法
-
面談前に送れる 定量質問テンプレ(コピペ可)
-
入社後ミスマッチを避ける レッド/グリーンフラグ
-
年収・働き方・成長の3軸で比べる オファー比較表
まずは“落とし穴”を把握:求人票だけでは見抜けないポイント
経験上、入社後ミスマッチの多くは求人選びの初動で防げます。特に次の3点は文章から読み落としがち。
- 肩書きが豪華:役割は「分析/資料作成が9割」というケース
- モデルが飾り:精度の言及はあるが、導入/監視/意思決定が書かれていない
- 人と仕組みが薄い:レビュー/CI/テストが無く、属人化している
要件→データ→運用の3本線が求人票で一貫していれば“当たり”の可能性が高いです。
筆者の現場メモ
大手のデータ/マーケサイエンティストとして10年。採用側・伴走側の両面で見て、CV±stdやPRレビューの運用が語れる会社は、オンボーディングが短く成果も早い印象でした。
使い方ガイド:45項目チェックリスト(5観点)で“点数化”する
- 各項目を 0/1/2点 で採点(0: 無/弱い, 1: どちらとも, 2: 明確にある)。
- まずは60点以上を「応募優先」ラインの目安に。
1) 業務内容の粒度(要件→タスクの具体性)
- 課題定義がある(KPI/目的関数の言及)
- タスク分解(要件→ETL→分析/ML→可視化→施策)
- SQL/ETL比率 の明示(例:5割)
- 打ち手の運用(A/B、閾値、意思決定会)
- ノートだけでなくスクリプト運用がある
- 意思決定者との接点(事業/プロダクトMTG)
2) データ/基盤の成熟度
- DWH/データレイク(BigQuery/Redshift/Snowflake 等)
- メタデータ/データ辞書
- スキーマ管理(dbt/契約テスト)
- ETL/ELT自動化(Airflow/Composer 等)
- イベント計測の定義(コーホート等)
- Git必須(ブランチ運用がある)
3) 検証と運用の仕組み
- CV(交差検証)±std で評価
- 指標設計(PR-AUC/MAE/ROC 等)
- A/B運用(CI/検出力/実験設計)
- モデル監視(分布/性能ドリフト)
- CI+テスト(pytest/契約テスト)
- デプロイ形態(バッチ/オンライン)と アラート/SLA
4) レビュー文化と人の厚み
- PRレビュー必須(差し戻し率などの運用指標あり)
- コード規約/リンター(flake8/black 等)
- デザインレビュー(図・レポート)
- MLOps/DEの専任 がいる
- メンター/上長の専門性(経歴/発信)
- 学習支援(書籍/カンファ/社内LT)
5) 裁量とキャリア動線
- 課題選定の裁量(提案→実行の余地)
- 職種横断(DA/DS/DEの協業・育成)
- 昇給/評価ロジック の明確化
- 在宅/フレックスの実運用
- 異動/役割拡張ルート
- 採用計画(一人目/チーム拡張)
ボーナス加点例:データカタログ/系統図、社外発表/技術ブログ、ダッシュボード定義書、A/Bレポート実例、失敗事例共有、採用課題の数字、30/60/90オンボーディング、poetry などの依存管理、データ品質SLA、権限設計、匿名化手順、BI運用、意思決定会の運用 など。
スコアリング表(コピペ用)
| 観点 | 主要項目 | 0 | 1 | 2 | 得点 |
|---|---|---|---|---|---|
| 業務内容 | 課題定義/タスク分解 | 無 | どちらとも | 明確にある | |
| データ基盤 | DWH/スキーマ管理 | 無 | 一部 | 明確に運用 | |
| 検証/運用 | CV±std/A/B/監視 | 無 | 案件次第 | ほぼ常時 | |
| レビュー | PR必須/差し戻し率 | 無 | チーム次第 | 明確に必須 | |
| キャリア | 在宅/裁量/評価 | 無 | 部署次第 | 運用で担保 | |
| 合計 |
使い方:気になる求人を3社並べて点数化 → 60点以上を第一候補に。
面談で使う「定量質問テンプレ」(そのまま送ってOK)
返答が数字で返ってくる会社は「仕組みが回っている」可能性が高いです。下記をそのまま送ってOK。
【要件/業務】
・直近6ヶ月で最も価値を生んだ意思決定は?使用指標と再現性(Git/CI)は?
・分析→意思決定→運用までの平均リードタイム(日数)は?
【データ/基盤】
・DWH/ETL/BIの構成(主要ツール)と、スキーマ変更時の契約テストは?
・データ品質SLA(遅延/欠損率)の目安は?
【検証/運用】
・CV設計(fold/±std)とA/Bの検出力の基準は?
・モデル監視の指標(ドリフト/閾値逸脱)は?
【レビュー/人】
・PR差し戻し率とレビュー平均所要時間は?
・メンター/上長の専門分野と30/60/90のオンボーディング計画は?
【働き方/キャリア】
・在宅/フレックスの実態(曜日固定/コアタイム/非同期SLA)は?レッドフラグ / グリーンフラグ
レッドフラグ(避けたい兆候)
- 「分析結果を上に渡すだけ」「資料作りが中心」
- 「Gitは使っていない」「Jupyterのみ」「テスト/CIなし」
- 「ABはやっていない」「評価は正解率(不均衡を無視)」
- 「一人目採用」なのに上長が非専門職
- データ遅延が常態化、データ辞書なし
グリーンフラグ(狙い目の兆候)
- CV±stdで語る、PR-AUC/MAEなど妥当な指標選定
- PR必須、差し戻し率を可視化
- 意思決定会で図3点+結論1行
- オンボーディング30/60/90が明文化


最近のコメント