GPT-4o : GOOGLE vs OpenAI (SORA, AGI, IA x SEO et Gemini) - Google I/O

Emile Dev
14 May 202409:25

TLDRLa vidéo présente les dernières annonces de Google I/O, incluant le modèle VO, une alternative à OpenAI capable de générer des vidéos longues et de qualité. Le projet Astra, avec une mémoire et capacité d'analyse vidéo, est également mentionné. Google lance également la V2 de Gemini, qui combine recherche et résultats générés, et Music AI SoundBox pour l'aide à la création musicale. Des outils comme Google AI Overview et Notebook LM, qui permettent de générer des discussions à partir de documents, sont également présentés. Les nouvelles fonctionnalités pour les Google Pixels, comme la détection d'appels frauduleux et l'évolution de personnes dans les photos, complètent cette revue des annonces.

Takeaways

  • 🎥 Le modèle VO de Google, alternative à OpenAI, sera disponible prochainement pour une sélection de créateurs.
  • 📊 VO est légèrement inférieur à Open Isora mais bien supérieur à Renou ou Picalabs, avec la capacité de générer des vidéos au-delà de 60 secondes.
  • 🔍 Le projet Astra de Google inclut un mode de conversation avec un système de mémoire, permettant une analyse plus approfondie des vidéos.
  • 🗣️ Astra se souvient de l'emplacement des objets et offre une compatibilité avec des lunettes, bien que sans informations sur la simulation des émotions.
  • 🔐 Un code mentionné semble utiliser le chiffrement AES-CBC pour l'encodage et le décodage de données.
  • 📍 L'analyse géographique indique la région de King's Cross à Londres.
  • 🚀 Google a annoncé un nouveau modèle de recherche nommé Gemini, qui combine la recherche et les résultats générés par Gemini.
  • 📉 Gemini pourrait entraîner une chute de 25% du trafic selon les experts, mais pourrait aussi créer de nouvelles habitudes de recherche.
  • 🍳 Gemini V2 inclut un système de planification et de recherche par vidéo, avec des fonctionnalités comme Google Lens et Google AI Overview.
  • 🎼 Google annonce Music AI SoundBox, un outil pour aider à la création de musique.
  • 📚 L'application Google LM Notebook, disponible aux États-Unis, permet de prendre des notes et d'uploader des documents, avec une nouvelle fonctionnalité d'audio overview.

Q & A

  • Quel est le modèle VO de Google et comment se compare-t-il à Open Isora ?

    -Le modèle VO de Google est une alternative à Open Isora, qui a été annoncé et sera disponible dans les prochaines semaines. Il est légèrement inférieur à Open Isora mais bien supérieur à Renou ou Picalabs VO. Il est capable de générer des vidéos au-delà de 60 secondes avec des rendus intéressants.

  • Quel est le projet Astra et quelles sont ses particularités ?

    -Le projet Astra est un mode de conversation similaire à celui annoncé par OpenAI, mais avec un système de mémoire. Il se souvient de l'emplacement d'un objet et permet l'analyse de segments de vidéo, contrairement à Open qui se limite à des images d'une à deux secondes.

  • Quel est le rôle du système de mémoire dans Astra ?

    -Le système de mémoire dans Astra permet à l'IA de se souvenir de l'emplacement d'un objet dans la conversation, améliorant ainsi la cohérence et la pertinence des interactions.

  • Quelle est la différence entre les fonctionnalités de Google I/O et celles d'OpenAI ?

    -Google I/O a annoncé des fonctionnalités comme le modèle VO capable de générer des vidéos longues et Astra avec un système de mémoire. OpenAI, d'autre part, a annoncé des améliorations dans la reconnaissance d'images et la génération de texte.

  • Quels sont les avantages de Google I/O sur le marché de l'IA ?

    -Google I/O offre des avantages tels que la capacité de générer des vidéos plus longues, l'intégration de systèmes de mémoire dans les conversations et une compatibilité avec des lunettes, bien que les détails sur cette dernière soient limités.

  • Quel est le nouveau mode de conversation avec mémoire dans Astra ?

    -Le nouveau mode de conversation avec mémoire dans Astra permet à l'IA de se souvenir de l'emplacement d'objets et d'informations précédentes, améliorant ainsi l'expérience utilisateur.

  • Quelle est la différence entre les capacités de génération de vidéos de Google I/O et OpenAI ?

    -Google I/O est capable de générer des vidéos au-delà de 60 secondes avec des rendus intéressants, tandis qu'OpenAI se limite à des images d'une à deux secondes.

  • Quelle est la fonctionnalité de recherche combinée de Google I/O ?

    -La fonctionnalité de recherche combinée de Google I/O, appelée Géni V2, combine la recherche traditionnelle avec des résultats générés par Géni, à partir des sources présentes dans les résultats de recherche.

  • Quels sont les outils de musique proposés par Google I/O ?

    -Google I/O propose un outil de musique appelé Music AI SoundBox, qui aide à la création de musique.

  • Quelle est l'application LM Notebook et quelles sont ses fonctionnalités ?

    -LM Notebook est une application Google Web et mobile disponible aux États-Unis, qui permet de prendre des notes, d'uploader des documents et de travailler avec ces données. Elle a annoncé une fonctionnalité d'audio overview, qui génère une discussion à partir de vos documents.

Outlines

00:00

🎥 Introduction to VO Model and Astra Project

The video discusses the unveiling of VO, Google's alternative to Open AI's DALL-E. VO is positioned to be slightly inferior to Open AI's model but significantly superior to other competitors like Renou or Picalabs. It is capable of generating videos over 60 seconds with impressive results. The script also introduces the Astra project, a conversational AI with a memory system that can track object placement and analyze video segments beyond single images. However, there is no information on whether it can simulate emotions or be interrupted. The video promises to show more demos as it progresses.

05:25

🚀 Google's AI Innovations and Updates

This paragraph covers a range of Google's AI announcements. It mentions the potential impact of a new search mode on traffic, suggesting a 25% drop according to some experts, but also the possibility of new search habits forming. Google's V2 integrates a planning system and is set to include video search deconstructions, Google Lens, and Google AI Overview. The paragraph also touches on Google's DeepMind's announcement of a new text-to-image model, which is slightly superior to DALL-E 3 and Gini Ultra. Google's AI Studio is now available in Europe and France, offering access to Gini Pro with a large context analysis capability at a competitive price. Additionally, Google has announced an open-source model, Gemma, and Music AI SoundBox, a tool for music creation. The video also highlights the Notebook LM application, which allows for note-taking and document uploading, and has introduced a feature for generating discussions from documents. Lastly, the paragraph mentions new features for Google Pixel, such as scam call detection and photo evolution tracking.

Mindmap

Keywords

💡VO

VO fait référence au modèle de génération de vidéos de Google, qui est présenté comme une alternative à OpenAI. Dans le script, il est mentionné que VO est légèrement inférieur à Open Isora mais bien au-dessus de Renou ou Picalabs VO. Cela indique que VO est un outil capable de générer des vidéos de qualité, bien que pas encore au niveau de la technologie la plus avancée d'OpenAI.

💡Open Isora

Open Isora est probablement un système ou un modèle de génération de contenu développé par OpenAI, bien que le script ne fournisse pas de détails spécifiques sur ses fonctionnalités. Il est utilisé comme point de comparaison pour évaluer les performances de VO, suggérant qu'il représente un standard dans le domaine de la génération de contenu.

💡Astra

Astra est mentionné comme un projet de Google qui inclut un mode de conversation avec une fonctionnalité de mémoire. Cela signifie qu'Astra est capable de se souvenir de l'emplacement d'un objet ou d'informations précédemment discutées, ce qui est une caractéristique avancée pour une IA. L'exemple donné dans le script est que Astra pourrait analyser des segments de vidéo, ce qui est une capacité intéressante pour une meilleure compréhension et interaction avec le contenu.

💡Google I/O

Google I/O est un événement de lancement de produits et de conférence technique organisé par Google, où sont annoncés de nouveaux produits et mises à jour. Le script fait référence à Google I/O comme le cadre dans lequel ces annonces technologiques ont été faites, indiquant l'importance de cet événement pour la présentation des nouvelles technologies de Google.

💡Gémini

Gémini est mentionné comme un élément clé de la nouvelle expérience de recherche de Google, qui combine la recherche traditionnelle avec des résultats générés par l'IA. Dans le script, il est dit que Gemini est équipé d'un modèle personnalisé, ce qui suggère qu'il s'agit d'une technologie de pointe utilisée pour améliorer l'expérience utilisateur de recherche.

💡Google AI

Google AI fait référence à la division d'intelligence artificielle de Google, qui est responsable du développement de technologies telles que les modèles de langage et les outils d'analyse d'images. Dans le script, Google AI est mentionné en relation avec plusieurs annonces, comme la nouvelle version de Gemini et Google AI Overview, montrant l'ampleur de l'engagement de Google dans le domaine de l'IA.

💡Google Lens

Google Lens est un outil de reconnaissance d'image développé par Google, capable de fournir des informations sur les objets photographiés. Dans le script, il est mentionné que Google Lens sera intégré dans les nouvelles fonctionnalités, permettant une recherche par vidéo et une décomposition de vidéos en plusieurs images, ce qui est une évolution de la technologie de reconnaissance d'image.

💡GPT

GPT est l'abréviation de 'Generative Pre-trained Transformer', un type de modèle de langage développé par OpenAI. Dans le script, GPT est mentionné en parallèle avec les technologies de Google, suggérant une comparaison entre les avancées de Google et celles d'OpenAI dans le domaine de l'IA.

💡Music AI SoundBox

Music AI SoundBox est un outil de création musicale mentionné dans le script, qui est développé par Google pour aider les utilisateurs à créer de la musique. Cela indique que Google étend ses technologies d'IA à d'autres domaines créatifs, comme la musique, en offrant des outils pour faciliter la composition et la production.

💡LM Notebook

LM Notebook est une application de prise de notes et de traitement de documents mentionnée dans le script. Elle est décrite comme une application 'cerveau secondaire', permettant aux utilisateurs de prendre des notes, d'uploader des documents et de travailler avec ces données. L'annonce d'une nouvelle fonctionnalité, l'audio overview, permettrait de générer des discussions à partir des documents, ce qui est une avancée intéressante pour l'interaction avec le contenu.

Highlights

La vidéo a été générée par le modèle VO, l'alternative de Google à OpenAI's Eoraa.

VO est légèrement inférieur à Open Isora mais supérieur à Renou et Picalabs.

VO peut générer des vidéos au-delà de 60 secondes avec des rendus intéressants.

Le projet Astra a été annoncé avec des capacités de mémoire et d'analyse vidéo.

Astra se souvient de l'emplacement d'objets et offre une compatibilité avec des lunettes.

Un code de chiffrement et de déchiffrement utilisant AES-CBC est mentionné.

La localisation King's Cross à Londres est identifiée.

Des suggestions pour améliorer les performances entre le serveur et la base de données sont discutées.

Astra pourrait simuler des émotions et interagir avec les utilisateurs.

Un nouveau mode de conversation avec GPT est annoncé, incluant des informations récentes.

Google lance la V2 de son moteur de recherche avec une intégration de génération de contenu.

La V2 pourrait entraîner une chute de 25% du trafic selon les experts.

Google annonce un système de planification avec des recettes et des recherches.

Google Lens et Google AI Overview seront disponibles prochainement.

Google Deep Mind a annoncé un modèle texte-image supérieur à Dali 3 et Gini Ultra.

Google Studio est disponible en Europe, offrant des analyses de grandes quantités d'informations.

Google propose une version Open Source de son modèle Gemma.

Music AI SoundBox, un outil pour aider à la création de musique, est annoncé.

L'application LM Notebook permet de prendre des notes et de générer des discussions audio à partir de documents.

Des nouvelles fonctionnalités pour Google Pixel sont présentées, incluant la détection d'appels frauduleux.

Google Photo offre une fonctionnalité pour visualiser l'évolution des personnes sur des photos.