Nel corso della conferenza AWS re:Invent di Las Vegas, riservata agli sviluppatori, Amazon ha annunciato diverse novità nel campo dell’intelligenza artificiale, computer vision e deep learning. AWS DeepLens è una videocamera che sfrutta diverse tecnologie per il riconoscimento degli oggetti, eseguendo in locale tutti i calcoli necessari. Oltre ai tool per il riconoscimento video, l’azienda di Seattle ha svelato servizi per trascrizione, traduzione e comprensione del linguaggio naturale.
AWS DeepLens integra un sensore da 4 megapixel che può catturare video a risoluzione 1080p in abbinamento ad un array di microfoni 2D. All’interno della videocamera c’è un processore Intel Atom X5 che offre una potenza di 100 GFLOPS, sufficienti per elaborare i frame video in tempo reale attraverso i modelli deep learning caricati negli 8 GB di storage. La connettività è garantita dal modulo WiFi dual band e dalle porte USB e micro HDMI. Il sistema operativo installato è Ubuntu 16.04. DeepLens usa le librerie Intel clDNN (Compute Library for Deep Neural Networks) per eseguire i modelli di computer vision.
La videocamera è in grado di riconoscere cani, gatti, volti, oggetti, movimenti e azioni. Ovviamente DeepLens è strettamente integrata con altri servizi cloud offerti dall’azienda, tra cui Amazon Rekognition Video, e può operare con Amazon SageMaker, un nuovo servizio che semplifica lo sviluppo, il training e la distribuzione dei modelli IA.
Altri tool annunciati durante la conferenza AWS re:Invent sono Amazon Transcribe, Amazon Translate e Amazon Comprehend. Transcribe può analizzare registrazioni vocali memorizzate sul cloud e trascrivere accuratamente ogni parola. Translate utilizza invece le reti neurali per effettuare la traduzione da o verso l’inglese. Infine, Comprehend analizza il testo e comprende il significato delle parole.