Multimodal models like Gemini are pushing the boundaries of what’s possible by unifying traditionally siloed data modalities. With Gemini, you can build applications that seamlessly understand and reason across text, images, and videos, enabling a new class of intelligent systems. For example, building a virtual interior designer that can analyze a user’s room images, understand their style preferences from a text description, and generate personalized design recommendations. Or creating a smart document processing pipeline that can extract structured data from complex PDFs, answer questions based on the content, and generate human-like summaries.



Empfohlene Erfahrung
Was Sie lernen werden
Learn state-of-the-art techniques for getting the most out of multimodal AI with Google’s Gemini model family.
Leverage the power of Gemini’s cross-modal attention to fuse information from text, images, and video for complex reasoning tasks.
Extend Gemini’s capabilities with external knowledge and live data via function calling and API integration.
Kompetenzen, die Sie festigen
- Kategorie: Real Time Data
- Kategorie: Application Programming Interface (API)
- Kategorie: Generative AI
- Kategorie: Text Mining
- Kategorie: Prompt Engineering
- Kategorie: Application Development
- Kategorie: Image Analysis
Wichtige Details
Juli 2025
Nur als Desktop-Version verfügbar
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Lernen, üben und anwenden von berufsrelevanten Fähigkeiten in weniger als 2 Stunden
- Nehmen Sie an Schulungen von Branchenexperten teil
- Sammeln Sie mit Aufgaben aus der realen Welt praktische Erfahrung

Über dieses Projekt
Dozent

Was Sie beim Lernen erwartet
Praktisches, projektbasiertes Lernen
Üben Sie die Anwendung neuer Kompetenzen, indem Sie berufsbezogene Aufgaben anhand von detaillierten Anweisungen lösen.
Keine Downloads oder Installation erforderlich
Greifen Sie in einer Cloud-Umgebung auf die Tools und Ressourcen zu.
Nur für Desktop verfügbar
Dieses Projekt ist für die Bearbeitung an einem Laptop oder Desktop-Computer mit stabiler Internetverbindung konzipiert und nicht für Mobilgeräte.
Warum entscheiden sich Menschen für Coursera für ihre Karriere?




Ihnen könnte auch Folgendes gefallen:
- Status: Kostenlos
DeepLearning.AI
- Status: Kostenlos
Google Cloud
- Status: Kostenloser Testzeitraum
Vanderbilt University
- Status: Kostenlos
DeepLearning.AI

Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Bei Projekten absolvieren Sie eine Aktivität oder ein Szenario, indem Sie in einer interaktiven, praxisnahen Umgebung eine Reihe von Anweisungen befolgen. Projekte werden in einer echten Cloud-Umgebung und in echten Instanzen verschiedener Produkte bearbeitet, nicht in einer Simulation oder Demo-Umgebung.
Mit dem Kauf eines Projekts erhalten Sie alles, was Sie zum Abschluss des Projekts benötigen, einschließlich des vorübergehenden Zugriffs auf jedes Produkt, das zum Abschluss des Projekts nötig ist.
Auch wenn Projekte theoretisch auf Mobilgeräten verfügbar sind, empfehlen wir Ihnen dringend, sie nur auf einem Laptop oder Desktop-Computer zu bearbeiten.