書籍
書籍

先輩データサイエンティストからの指南書 -実務で生き抜くためのエンジニアリングスキル

0.0

販売価格

¥
2,860
税込
還元ポイント

販売中

お取り寄せ
発送目安
2日~14日

お取り寄せの商品となります

入荷の見込みがないことが確認された場合や、ご注文後40日前後を経過しても入荷がない場合は、取り寄せ手配を終了し、この商品をキャンセルとさせていただきます。

フォーマット 書籍
発売日 2025年08月27日
国内/輸入 国内
出版社技術評論社
構成数 1
パッケージ仕様 -
SKU 9784297151003
ページ数 240
判型 A5

構成数 : 1枚

第1章実務で生き抜くためのエンジニアリングスキル
1.1データサイエンティストを取り巻く環境の変遷
1.1.1希少価値が高かったデータサイエンティスト黎明期
1.1.2技術民主化の波とPoC 止まりの現実
1.1.3データサイエンスを価値に繋げるために
1.2プロジェクトで求められるエンジニアリングスキル
1.2.1データサイエンスプロジェクトのフロー
1.2.2データサイエンティストのスキル習得プロセスによる課題
1.2.3データサイエンスプロジェクト特有の難しさ
1.2.4価値を生むために必要なエンジニアリングスキル
1.3まとめ

第2章環境構築
2.1分析の土台としての環境構築
2.1.1なぜ環境構築が大切か
2.1.2適切な環境構築をするために
2.2リポジトリの構造を整える
2.2.1適切な構造のリポジトリを作るメリット
2.2.2本書で扱うリポジトリ構成
2.3VS Codeでの開発環境の整備
2.3.1VS Code の設定
2.3.2VS Code の拡張機能
2.3.3VS Code のデバッガ
2.3.4VS Code のショートカット
2.4Dev Container による仮想環境構築
2.4.1仮想環境とは
2.4.2仮想環境の種類
2.4.3Docker とDocker Compose
2.4.4Dev Container の使い方
2.5uv によるパッケージ管理
2.5.1パッケージ管理
2.5.2パッケージマネージャーの比較
2.5.3uv によるパッケージ管理
2.6まとめ

第3章コードの品質管理
3.1Notebookだけのデータサイエンティストからの卒業
3.1.1Notebookの手軽さと課題
3.1.2Notebook vs Python Script
3.1.3NotebookユーザーのためのPython Script入門
3.1.4一歩上のNotebookの使い方
3.2コード品質とは
3.2.1コード品質の重要性
3.2.2品質の高いコードとは
3.3品質の高いコードとその実現方法
3.3.1関数
3.3.2クラス
3.3.3命名
3.3.4コメントの書き方
3.3.5コーディング規約
3.3.6型ヒントと静的型チェック
3.3.7テスト
3.3.8品質の高いコードを書けるようになるためには
3.4コードレビューによる品質管理
3.4.1コードレビューとは
3.4.2コードレビューの利点と継続のために
3.4.3Gitブランチ戦略を取り入れる
3.4.4コードレビューの心得
3.4.5チームでの効果的なコードレビューを目指して
3.5まとめ

第4章データの品質確認
4.1データの品質確認の重要性
4.1.1データの品質との向き合い方
4.1.2現場のデータが汚い原因
4.2分析開始前のデータ確認
4.2.1データの背景を理解する
4.2.2データの品質を理解する
4.3Panderaによるデータフレームのバリデーション
4.3.1データ加工時の品質担保
4.3.2Panderaによるバリデーション
4.4データ品質管理の継続的な取り組み
4.4.1データの変化のモニタリング
4.4.2データ基盤チームとの連携による品質改善
4.5まとめ

第5章機械学習モデルの実験管理
5.1実験管理の意義
5.1.1データサイエンスプロジェクトの不確実性
5.1.2実験管理の必要性
5.1.3実験管理ツール
5.2Hydraによるパラメータ管理
5.2.1Hydraの概要
5.2.2Hydraのインストール
5.2.3Hydraの基本機能
5.2.4Hydraの実践的な機能
5.3MLflowによる実験の比較
5.3.1MLflowの概要
5.3.2MLflowのインストール
5.3.3MLflow Trackingのコンセプト
5.3.4MLflow Trackingによる実験管理
5.4まとめ

第6章プロトタイプ開<...

  1. 1.[書籍]

データサイエンティストに求められるスキルは、いまや分析技術だけではありません。実務で活躍できるデータサイエンティストになるためには、チームでの働き方も身に付けなければいけないでしょう。本書では、分析環境の準備・分析データのチェックから、機械学習モデルの運用やプロトタイプ開発まで、データサイエンティストが抑えるべき「分析前後」の知識を身に付けられます。ワンランク上のデータサイエンティストになるための、強力なガイドとなる本です。

作品の情報

メイン

メンバーズレビュー

レビューを書いてみませんか?

読み込み中にエラーが発生しました。

画面をリロードして、再読み込みしてください。