※画像は生成AIによるイメージです

第5回:画像・動画データの処理を自動化する!CogniflowとFelo Agentの連携実践

連載: ノーコードAIエージェント構築ガイド cogniflowautomationimage-processing

連載「非エンジニアのためのAIエージェント構築」も、ついに最終回を迎えました。これまでにテキストベースの議事録作成や、自社マニュアルの学習といった「言語情報」を扱うエージェント構築を学んできましたが、実務の現場では「画像」や「動画」といった視覚情報の処理も不可欠です。

今回は、ノーコードでAIモデルを構築できるツール「Cogniflow」と、これまで構築してきた「Felo Agent」を組み合わせ、画像・動画データを自動処理する高度なワークフローの構築方法を解説します。

1. なぜ画像・動画データの自動処理が必要なのか?

多くのビジネス現場において、画像や動画の確認作業は「人間が目視で行う」ことが前提となっています。例えば、検品作業、製品の不備チェック、SNS上のブランド監視、あるいは現場の安全確認などが挙げられます。

しかし、人間による目視は疲労による見落としのリスクがあり、また膨大なデータを処理するには時間がかかりすぎます。AIエージェントに「目」を持たせることで、以下のようなメリットが生まれます。

  • 一貫した基準での判断: AIは疲労せず、常に一定の精度で分類や検知を行います。
  • リアルタイム対応: 監視カメラやアップロードされた画像を即座に解析し、異常があれば即座にアラートを出すことが可能です。
  • 業務の抽象化: 現場の担当者は「異常が発生した際」のみ対応すればよくなり、単純な監視業務から解放されます。
解説画像 1 ※画像は生成AIによるイメージです

2. Cogniflowで「視覚AI」をノーコード構築する

Cogniflowは、プログラミング知識がなくても、画像や動画を認識するためのAIモデルを作成できる強力なツールです。まずは、ここで特定の対象を認識するモデルを作成します。

ステップ1:教師データの準備とアップロード

Cogniflowのダッシュボードで「画像分類(Image Classification)」または「物体検出(Object Detection)」を選択します。重要なのは、AIに「何を認識させたいか」を教える教師データです。

  • ポイント: 認識させたい対象(例:製品の傷、特定のラベル、作業環境の異常など)を、少なくとも20〜50枚程度用意しましょう。
  • コツ: さまざまな角度、明るさ、背景で撮影した画像を用意することで、AIの判断精度が劇的に向上します。

ステップ2:トレーニングと評価

アップロード後、Cogniflow上でタグ付け(ラベル付け)を行い、トレーニングを実行します。完了すると、モデルの精度(Accuracy)が表示されます。ここで精度が低い場合は、さらにデータを追加して再学習させるのが定石です。

3. Felo Agentとの連携:視覚情報を判断に変える

Cogniflowで作成したモデルは、APIとして呼び出すことができます。ここで、これまで構築してきたFelo Agentと連携させます。

連携の全体像

  1. 入力: Webカメラや共有フォルダに画像/動画がアップロードされる。
  2. 解析: Cogniflow APIが画像を解析し、結果(クラス名や信頼度)を返却する。
  3. 判断と実行: Felo Agentがその解析結果を受け取り、「異常あり」と判断された場合のみ、Slackやメールで担当者に通知を送る、あるいはレポートを自動作成する。

このフローを構築する際、ZapierMakeといったノーコード自動化ツールを「接着剤」として利用するのが最も効率的です。

つまずきやすいポイントと対策

  • APIレスポンスの遅延: 動画処理は重くなることがあります。まずは「静止画の定期的な切り出し」から始めるのが、システムを安定させるコツです。
  • 誤検知の許容範囲: AIは100%ではありません。Felo Agentのプロンプトで、「信頼度(Confidence Score)が80%未満の場合は担当者に再確認を促す」といった「人間による最終判断」のステップを必ず組み込んでください。

4. ビジネス現場での実運用テストと改善

モデルが完成したら、いきなり全業務を任せるのではなく、まずは「テスト運用」から開始してください。

  1. サイレントモードでの試行: 実際の業務フローとは別に、数日間稼働させて「AIが判断した結果」と「人間が判断した結果」が一致しているかを確認します。
  2. プロンプトの調整: Felo Agentが解析結果をどのように解釈し、どのような言葉で担当者に報告するかが重要です。単に「異常」と伝えるのではなく、「どの部分にどのような異常の可能性があるか」を詳細に記述させるよう、指示を調整しましょう。
  3. ハードウェアの最適化: 高画質な画像処理には、安定した撮影環境が不可欠です。Webカメラの画角や照明、あるいは大容量データを一時的に保存するための外付けSSDなどを活用し、物理的な環境を整えることも、AIの精度を底上げする重要な要素です。

まとめ:AIエージェントと共に進化する業務

全5回の連載を通じて、AIエージェントは単なるチャットツールではなく、言語、知識、そして視覚までも統合して業務を遂行する「デジタルスタッフ」になり得ることを解説してきました。

非エンジニアの強みは、現場の課題を誰よりも深く理解していることです。技術的な細かい実装に悩むよりも、「どのようなフローがあれば現場が楽になるか」という視点を持ち続け、小さく始めて大きく育てる(イテレーション)の精神を忘れないでください。

Felo Agentと他のツールを組み合わせることで、あなたの業務は今後さらに自動化され、より価値ある仕事に集中できる時間が増えるはずです。ぜひ、今回の内容を参考に、自社独自のAIエージェント構築に挑戦してみてください。