求人・案件情報
GPU活用機械学習環境監視拡張/Prometheus・Grafana設定支援
本日 18時30分 に公開
業務内容:大規模分散機械学習基盤における監視機構の拡張・最新化を実施します。GPU/CPUノードに加えて、未監視のストレージやスイッチも対象とし、Prometheus と Grafana 系ツールで可視化・アラートを構築します。Ansible を用いた設定自動化や Docker コンテナ化も行います。
担当工程:
設計、構築、設定、運用自動化
スキル:
必須:Linux、Python、Ansible、Docker、Go
尚可:Prometheus、Grafana OnCall、Grafana ダッシュボード、PromQL
稼働場所:
フルリモート
その他:
業種:情報・通信・メディア
開始時期:相談に応じて調整
金額
560,000円/月
案件ID:282496