GPU活用機械学習環境監視拡張/Prometheus・Grafana設定支援

昨日 18時30分 に公開

業務内容:
大規模分散機械学習基盤における監視機構の拡張・最新化を実施します。GPU/CPUノードに加えて、未監視のストレージやスイッチも対象とし、Prometheus と Grafana 系ツールで可視化・アラートを構築します。Ansible を用いた設定自動化や Docker コンテナ化も行います。

担当工程:
設計、構築、設定、運用自動化

スキル:
必須:Linux、Python、Ansible、Docker、Go
尚可:Prometheus、Grafana OnCall、Grafana ダッシュボード、PromQL

稼働場所:
フルリモート

その他:
業種:情報・通信・メディア
開始時期:相談に応じて調整

金額

560,000円/月

案件ID:282496





前の案件 案件一覧へ戻る次の案件