- TOP >
- サーバ 東京都 の案件
- > フルリモート/AI学習基盤監視拡張・Promet
求人・案件情報
フルリモート/AI学習基盤監視拡張・Prometheus・Grafana最新化
本日 00時40分 に公開
業務内容:- AI学習基盤におけるGPU/CPUノードの監視機構拡張
- ストレージおよびネットワークスイッチを監視対象に追加
- 監視システム(Prometheus、Grafana OnCall、Grafana ダッシュボード)の導入・最新化
担当工程:
- 監視要件定義・設計
- Ansible・Dockerを用いた環境構築
- Python/Goスクリプトによる監視エージェント実装
- テスト・検証および運用引き継ぎ
スキル:
必須:Linux、Python、Ansible、Docker、Go
尚可:Prometheus、Grafana OnCall、Grafana ダッシュボード、PromQL
稼働場所:
フルリモート
その他:
業種:情報・通信・メディア
プロジェクト期間:即日開始または相談可
案件ID:316611
