AI-oplossing

Vragen stellen en antwoorden krijgen over geüploade foto's met GenAI

Inleiding

Het menselijk oog kan meestal de inhoud en betekenis van een eenvoudige foto ontcijferen. Nu met de mogelijkheid van generatieve AI om enorme hoeveelheden data te identificeren en te interpreteren, kunnen computersystemen deze taak nabootsen.

Deze oplossing laat u zien hoe u een eenvoudige image-to-text-app kunt maken waarmee gebruikers een afbeelding kunnen uploaden, een natuurlijke taalprompt kunnen invoeren die een query over de afbeelding beschrijft en een op tekst gebaseerde reactie kunnen ontvangen die door het AI-model is gegenereerd. Door gebruik te maken van een eenvoudige interface die is gebouwd met Streamlit, een base64-imagedecoder en door gebruik te maken van de generatieve AI-inferentie-API van Oracle Cloud Infrastructure (OCI) voor het verwerken van multimodale gegevens (tekst en afbeeldingen), is deze oplossing eenvoudig samen te stellen en dient deze als een ideaal ingangspunt om AI-services uit te proberen op OCI.

-demonstratie

Demo: Stel vragen en krijg antwoorden over geüploade foto's met behulp van GenAI (1:19)

Vereisten en instellingen

  1. Oracle Cloud account: aanmeldingspagina
  2. OCI Generative AI: documentatie
  3. Streamlit: documentatie