Googleが提供する「Vision AI」とは?仕組みや実現できること

「クラウドによる画像認識を活用して業務を効率化させたい」

「GoogleのVision AIにより何を実現できるのか興味がある」

画像をクラウド上で分析して、APIなどで便利な機能を提供するシステムがVision AIです。アップロードした画像を自動処理するため、作業効率の改善に繋げられるのがメリット。

Googleが提供する「Vision AI」とは?

Googleが提供する「Vision AI」とは?

この記事ではVision AIの仕組みや実現できることを紹介します。

Vision AIとは

Google Cloud Platformで利用できるサービスの1つとしてVision AIがあります。クラウド上で画像を分析できて、分類や検出といった作業を自動化できるのがVision AIの特徴です。

例えばアメリカの大手電力会社であるAESは、ドローンで撮影した機器の様子をVision AIで分析。紹介映像 により発電機の損傷をコンピュータ上に表してくれることが分かります。

Vision AIには「AutoML Vision」と「Vision API」という2つのプロダクトがあり、用途に合わせてサービスを利用することが可能です。それぞれのプロダクトについて詳しく解説します。

簡単に使えるAutoML Vision

AutoML Visionはクラウド上で画像をスムーズに分析することを目的としたプロダクト。簡単な操作で画像をアップロードできて、分析結果を各種デバイスにエクスポートできます。

AutoML Vision

AutoML Vision

Web上で活用できるから操作するハードルが低く、プログラミングが分からない人でも扱いやすいのがメリット。ただ、使いやすさが重視されている分、利用できる機能は少なめです。

高度な機能を使えるVision API

Vision APIはオブジェクトの検出や分析に役立つエンジニア向けのサービスです。機械学習の知識がなくても、クラウド上の画像認識サービスを活用できます。

Google Cloud Platform - vision api

Google Cloud Platform – vision api

APIに送信した画像の分析結果は約1秒で戻り、役に立つデータをすぐに得られるのがメリット。AutoMLよりも利用できる機能は多いですが、Web上だけで利用することはできません。

お試しで利用する方法

「Vision AIで実際に画像分析してみたい」と思う人は多くいるでしょう。Google CloudのVision AIには「Try the API」という項目があり、そこに画像をアップロードすることで試用できます。

体験利用で出力されるデータ項目は次の通りです。

  • Faces:画像における顔部分の抽出
  • Objects:画像における物体の認識
  • Labels:画像に対する分類
  • Web:画像とWeb上で関連した要素の検索
  • Properties:画像のカラー割合とアスペクト比率
  • Safe Search:画像が不適切なコンテンツを含んでいるのか検出

実際にVision AIで開発するときは、先に公式サイトで画像認識を体験してみることがオススメです。

Vision AIで実現できること

アプリやソフトウェアの開発にVision AIを活用することで、次のような機能を実現できます。

  • 画像からオブジェクトの分類や位置を自動検出
  • 画像のテキストを認識して作業を自動化
  • 不適切なコンテンツを検出して排除
  • 画像から人物の顔や製品のロゴを識別
  • インターネット上の類似画像を検索

実際に株式会社サイバーエージェントがVision APIを導入して、画像のタグ付けを自動化した事例 があります。業務の効率化を実現させるためにVision AIを活用することがオススメです。

まとめ

Vision AIはGoogle Cloudで利用できる画像認識サービスです。2種類のプロダクトにより画像を自動で分析できて、業務時間の短縮や手間の削減を可能とするのがメリット。

「新しい技術で仕事をより効率化させたい」と考えている人にVision AIの活用を勧めます。

ONETECHでも、AI開発の実績もすでにいくつかございます。

3DCG制作
商品のAI画像認識のための学習モデル用のCG制作
ある商品(消費財)のAI画像認識のための教師データ用のCGを制作しました。商品の現物を参考にしながら酷似したCGモデルを制作しました。CGモデルをUnityで様々な角度や陰影をつけた画像をAIの学習データとして抽出します。Unityのツールも開発しました。
7セグメントディスプレイのデジタル数字認識OCRモジュール開発(SSOCR)
7セグメントディスプレイのデジタル数字を認識するモジュールを開発しました。 デバイスのデジタル数字が表示されている枠内の数字を自動解析します。決定木の手法と SSOCR(seven segment optical character recognition)を利用しました。 このモジュールはホロレンズ(Microsoft HoloLens)、スマホなども応用可能です。
OpenCV+ AI Yoloで画像認識の研究開発。飲食店向けARクーポンアプリのデモ
OpenCV+ AI Yolo画像認識の研究開発 今回は2018年のセミナーのプレゼンテーションのために以下の3つのデモを研究開発した実績をご紹介します。

AI Yolo + OpenCVをカスタマイズして開発実績

また日本の大手ゲーム会社、ホログラム技術の応用、自動車、建築などの3DCGモデリング、UV、テクスチャ、アニメーションをベトナムオフショアで制作。ONETECHのUNITYエンジニアと連携しゲームや、映像、3D映像 技術、3Dホログラム、AR/VRアプリなどワンストップで開発可能です。

お困りのことがありましたら。お気軽にご相談ください。

 

返信を残す

無料相談・お問い合わせ
insightscanXのお問い合わせもこちらからお願いします。
2025年1月からフリートライアル募集中
ご相談やお見積もりは全て 無料 で対応いたします。

    「個人情報保護方針」をお読みいただき同意いただける場合は「送信」ボタンを押して下さい。
    入力していただいたメールアドレス宛に自動返信メールを送信していますので、お手数ですがそちらをご確認ください。
    無料相談・お問い合わせ
    insightscanXのお問い合わせもこちらからお願いします。
    2025年1月からフリートライアル募集中
    ご相談やお見積もりは全て 無料 で対応いたします。

      「個人情報保護方針」をお読みいただき同意いただける場合は「送信」ボタンを押して下さい。
      入力していただいたメールアドレス宛に自動返信メールを送信していますので、お手数ですがそちらをご確認ください。
      無料相談
      お問い合わせ