Veo 3, l'IA de Google pour créer des vidéos réalistes avec audio, est également disponible en Italie

Veo 3, le modèle d'intelligence artificielle de Google qui permet de générer des vidéos réalistes avec un son synchronisé, est également disponible en Italie.
Les utilisateurs abonnés à Gemini Pro , un forfait mensuel d'environ 22 euros permettant d'accéder aux fonctionnalités avancées de l'intelligence artificielle de Google, ont désormais accès à une version améliorée du modèle, appelée « Veo 3 Fast », également disponible en France. Cette variante est capable de générer des vidéos deux fois plus rapidement que la version standard. Les vidéos créées avec Veo 3 Fast ont une résolution de 720p et durent au maximum huit secondes.
Les abonnés « Pro » peuvent réaliser jusqu'à trois vidéos par jour. Passé ce seuil, l'application reviendra automatiquement à l'ancien modèle, Veo 2 .
Qu'est-ce que Veo 3Contrairement au modèle précédent, Veo 2, et à des outils comme Sora d'OpenAI , Veo 3 ne se limite pas à la génération d'images animées. Il intègre des effets sonores , des bruits ambiants et même des dialogues, en les synchronisant parfaitement avec l'action de la vidéo. L'IA de Google est ainsi capable de produire des vidéos avec des personnes parlant, dans plusieurs langues, dont l'italien . Le plus curieux est que Veo 3 est même capable de reproduire, de manière plus ou moins convaincante, les nuances des dialectes.
Construit sur une architecture de transformateur de diffusion, Veo 3 exploite les ressources informatiques massives de Google et probablement une partie importante des archives vidéo de YouTube pour sa formation, bien que DeepMind – l'équipe derrière l'IA la plus avancée de Big G – soit délibérément vague sur les détails.
Le résultat est un modèle capable de comprendre les lois de la physique du monde réel et de respecter des consignes narratives complexes, générant des clips de 8 secondes étonnamment réalistes.
La capacité du Veo 3 à gérer des invites nuancées (spécification des angles de caméra, des styles artistiques ou même des dialogues) le distingue clairement de la concurrence.
Par exemple, une invite décrivant un marin pointant du doigt une mer agitée tout en récitant un poème génère une vidéo avec des vagues qui s’écrasent, un vent hurlant et la voix du marin parfaitement synchronisée avec les mouvements de ses lèvres.
Cependant, Veo 3 n'est pas sans défauts : les gestes complexes de la main, comme compter avec les doigts, peuvent lui donner du fil à retordre, probablement en raison d'une mauvaise représentation dans les données d'entraînement.
Mais la capacité de ce modèle à simuler de manière réaliste la physique — comme une aurore boréale dansant dans le ciel arctique — donne à ses vidéos l’apparence de séquences réelles et professionnelles.
Ce qui rend Veo 3 véritablement révolutionnaire, c'est sa fusion native de la vidéo et de l'audio , une prouesse technique qui a longtemps été un défi pour les développeurs d'IA.
Contrairement à des modèles concurrents comme Runway ou Sora , qui nécessitent souvent une synchronisation audio en post-production, le Veo 3 génère simultanément les deux modes, garantissant une synchronisation labiale et une cohérence sonore ambiante parfaites. Il ne s'agit pas seulement d'une avancée technologique : c'est un changement de paradigme. Un changement qui peut stimuler la créativité, mais aussi donner naissance à des contenus controversés et offensants.
L'attente est terminée. @GeminiApp livre désormais Veo 3 *dans le monde entier* pour tous les membres Pro ! Cela signifie que l'Inde, l'Indonésie, toute l'Europe et plus encore commencent à avoir accès à la création de vidéos dès maintenant. En tant que membre, vous obtiendrez 3 générations de vidéos par jour, et ce crédit sera reconstitué… pic.twitter.com/uPa0p0KQZu
— Josh Woodward (@joshwoodward) 3 juillet 2025
Pour éviter tout abus, chaque image est marquée numériquement du filigrane SynthID de Google, invisible à l'œil nu mais théoriquement traçable. Depuis quelques semaines, un petit texte, « Veo », est également présent en bas à droite des vidéos générées.
Toutefois, cette mesure ne garantit pas que les utilisateurs moins attentifs – par exemple ceux qui parcourent rapidement le contenu des réseaux sociaux – se rendront compte qu’ils regardent une vidéo générée par l’IA.
Des vidéos racistes générées par l’IA circulent sur TikTok et semblent avoir été créées avec Veo 3 [le « Veo » en bas à droite ne laisse aucun doute].
Dans les vidéos en question, les Noirs sont représentés comme des singes ou des criminels. L'IA de Google a également été utilisée pour construire des récits faux ou trompeurs sur les migrants.
Ces contenus recueillent des millions de vues, malgré la diffusion d’images profondément offensantes et préjudiciables.
La Repubblica