Googleが提供する「Vision AI」とは？仕組みや実現できること

Nguyen Duong 25/12/2019 AI人工知能, ARCore, ARkit, Deep Learning, OneTechAsia, UNITY AR/VR/MR

「クラウドによる画像認識を活用して業務を効率化させたい」

「GoogleのVision AIにより何を実現できるのか興味がある」

画像をクラウド上で分析して、APIなどで便利な機能を提供するシステムがVision AIです。アップロードした画像を自動処理するため、作業効率の改善に繋げられるのがメリット。

Googleが提供する「Vision AI」とは？

この記事ではVision AIの仕組みや実現できることを紹介します。

目次 hide

1 Vision AIとは

1.1 簡単に使えるAutoML Vision

1.2 高度な機能を使えるVision API

1.3 お試しで利用する方法

2 Vision AIで実現できること

3 まとめ

3.1 ONETECHでも、AI開発の実績もすでにいくつかございます。

Vision AIとは

Google Cloud Platformで利用できるサービスの1つとしてVision AIがあります。クラウド上で画像を分析できて、分類や検出といった作業を自動化できるのがVision AIの特徴です。

例えばアメリカの大手電力会社であるAESは、ドローンで撮影した機器の様子をVision AIで分析。紹介映像により発電機の損傷をコンピュータ上に表してくれることが分かります。

Vision AIには「AutoML Vision」と「Vision API」という2つのプロダクトがあり、用途に合わせてサービスを利用することが可能です。それぞれのプロダクトについて詳しく解説します。

簡単に使えるAutoML Vision

AutoML Visionはクラウド上で画像をスムーズに分析することを目的としたプロダクト。簡単な操作で画像をアップロードできて、分析結果を各種デバイスにエクスポートできます。

AutoML Vision

Web上で活用できるから操作するハードルが低く、プログラミングが分からない人でも扱いやすいのがメリット。ただ、使いやすさが重視されている分、利用できる機能は少なめです。

高度な機能を使えるVision API

Vision APIはオブジェクトの検出や分析に役立つエンジニア向けのサービスです。機械学習の知識がなくても、クラウド上の画像認識サービスを活用できます。

Google Cloud Platform – vision api

APIに送信した画像の分析結果は約1秒で戻り、役に立つデータをすぐに得られるのがメリット。AutoMLよりも利用できる機能は多いですが、Web上だけで利用することはできません。

お試しで利用する方法

「Vision AIで実際に画像分析してみたい」と思う人は多くいるでしょう。Google CloudのVision AIには「Try the API」という項目があり、そこに画像をアップロードすることで試用できます。

体験利用で出力されるデータ項目は次の通りです。

Faces：画像における顔部分の抽出
Objects：画像における物体の認識
Labels：画像に対する分類
Web：画像とWeb上で関連した要素の検索
Properties：画像のカラー割合とアスペクト比率
Safe Search：画像が不適切なコンテンツを含んでいるのか検出

実際にVision AIで開発するときは、先に公式サイトで画像認識を体験してみることがオススメです。

Vision AIで実現できること

アプリやソフトウェアの開発にVision AIを活用することで、次のような機能を実現できます。

画像からオブジェクトの分類や位置を自動検出
画像のテキストを認識して作業を自動化
不適切なコンテンツを検出して排除
画像から人物の顔や製品のロゴを識別
インターネット上の類似画像を検索

実際に株式会社サイバーエージェントがVision APIを導入して、画像のタグ付けを自動化した事例があります。業務の効率化を実現させるためにVision AIを活用することがオススメです。

まとめ

Vision AIはGoogle Cloudで利用できる画像認識サービスです。2種類のプロダクトにより画像を自動で分析できて、業務時間の短縮や手間の削減を可能とするのがメリット。

「新しい技術で仕事をより効率化させたい」と考えている人にVision AIの活用を勧めます。

ONETECHでも、AI開発の実績もすでにいくつかございます。

3DCG制作

Kawamoto Naoki | 20/03/2021

商品のAI画像認識のための学習モデル用のCG制作

ある商品（消費財）のAI画像認識のための教師データ用のCGを制作しました。商品の現物を参考にしながら酷似したCGモデルを制作しました。CGモデルをUnityで様々な角度や陰影をつけた画像をAIの学習データとして抽出します。Unityのツールも開発しました。

詳細を見る

Nguyen Duong | 22/10/2020

７セグメントディスプレイのデジタル数字認識OCRモジュール開発（SSOCR)

７セグメントディスプレイのデジタル数字を認識するモジュールを開発しました。デバイスのデジタル数字が表示されている枠内の数字を自動解析します。決定木の手法と SSOCR（seven segment optical character recognition)を利用しました。このモジュールはホロレンズ(Microsoft HoloLens)、スマホなども応用可能です。

詳細を見る