データサイエンティスト 音声、自然言語処理モデル構築
こちらの案件は現在募集を
停止しています。
停止しています。
- 単価/月
- 60~75万円
- 勤務地
- 東京都,文京区
案件概要
音声認識後のテキストまたは音声データに基づき、発話ごとに会話のドメインや意図を分類し、ラベルを付与するモデルを構築します。
初期スコープでは、金融の日本語コールセンターデータを対象とする予定です。
後続フェーズにおいては、より言語理解寄り、BIOラベルの付与などに進んでいく可能性が高いです。
音声認識部分には既存モデルが存在するため、ノイズを含んだ純粋なNLPプロジェクトとして進めることも可能ですが、
E2Eで構築した方が精度が高い場合は、音声認識~言語理解まで含めたモデル構成とすることも可能です。
完成したモデルをプロダクション化する場面では別のMLエンジニアが入りますので、前処理 /モデル構築/評価部分のみをご担当いただく想定です。
<作業環境>
Windows/Mac選択可
<開発環境>
環境・OS:AWS(Amazon Web Services), Linux
<開発工程>
・要件定義
・基本設計
・詳細設計
・実装・構築・単体試験
<備考>
基本リモート
<基本時間>
10:00~19:00
<服装>
オフィスカジュアル
初期スコープでは、金融の日本語コールセンターデータを対象とする予定です。
後続フェーズにおいては、より言語理解寄り、BIOラベルの付与などに進んでいく可能性が高いです。
音声認識部分には既存モデルが存在するため、ノイズを含んだ純粋なNLPプロジェクトとして進めることも可能ですが、
E2Eで構築した方が精度が高い場合は、音声認識~言語理解まで含めたモデル構成とすることも可能です。
完成したモデルをプロダクション化する場面では別のMLエンジニアが入りますので、前処理 /モデル構築/評価部分のみをご担当いただく想定です。
<作業環境>
Windows/Mac選択可
<開発環境>
環境・OS:AWS(Amazon Web Services), Linux
<開発工程>
・要件定義
・基本設計
・詳細設計
・実装・構築・単体試験
<備考>
基本リモート
<基本時間>
10:00~19:00
<服装>
オフィスカジュアル
期間
即日 ~ 2022/12/31
言語
必須スキル・経験
・深層学習ベースの音声認識/NLPプロジェクトにおける開発経験
・BERTやWav2vecなどの自己教師あり学習+Fine-tuningからなるモデルアーキテクチャへの理解
・HuggingfaceやPytorchを利用した学習パイプラインの構築やモデルのチューニング経験
・BERTやWav2vecなどの自己教師あり学習+Fine-tuningからなるモデルアーキテクチャへの理解
・HuggingfaceやPytorchを利用した学習パイプラインの構築やモデルのチューニング経験
歓迎するスキル・経験
・音声対話システムの研究、開発経験
・クライアント向け説明、資料作成の経験
・AWS/Linux/Gitなど開発インフラに対する基礎知識
・クライアント向け説明、資料作成の経験
・AWS/Linux/Gitなど開発インフラに対する基礎知識
稼動日数
週5日
商談回数
1回
最寄駅
東京メトロ丸ノ内線 本郷三丁目駅
案件の詳細
即日参画OK / 商談1回 / 10時開始 / リモート / 原則リモート
リモート詳細
精算条件
140h-180h
支払サイト
月末締めの翌月末日払い
案件担当のおすすめポイント
データサイエンティストとして、音声・事前言語処理モデルの構築を支援して頂く案件です。基本リモートでご対応頂きます。