Fliki, entrez dans l’ère text-to-video

Fliki est une plateforme en ligne d'intelligence artificielle dont l’objectif est de vous permettre de créer une vidéo ou un podcast sans aucune compétences en montage ou en prise de son. À la manière des services IA qui se développent à grande vitesse en ce moment, il suffit de saisir du texte et de cliquer sur quelques boutons.

Text-to-speech

Avant même la création vidéo, le premier service rendu par Fliki concerne la voix via des fonctionnalités de text-to-speech. Difficile de faire plus simple : vous choisissez une voix parmi un catalogue particulièrement bien fourni de voix conçues pour différentes langues, vous copiez-collez votre texte et… c’est tout. Vous allez ensuite pouvoir jouer avec la vitesse de lecture mais la version gratuite ne permet pas d’autres traitements. 

Comme dans tous les sévices text-to-speech, pour être plus réaliste, il faudra jouer sur la ponctuation voire réécrire certains mots en phonétiques. À la première lecture vous allez forcément être surpris si vous avez utilisé deux ou trois mots anglais dans votre texte. 

Si des mots mal prononcés reviennent régulièrement, vous pourrez utiliser la fonctionnalité de “Pronounciation map” qui recherche et remplace automatiquement les mots problématiques par d’autres mots ou par une version phonétique. 

Fliki offre quelques options complémentaires pour le paramétrage fin des voix. Tout se passe dans le champ de saisie de texte. Les attributs de hauteur de voix (pitch) ou de vitesse de lecture (rate) se définissent pour un mot, une phrase ou pour tout le paragraphe. Vous pouvez également ajouter des secondes de pause entre deux mots ou deux phrases.

Trouver votre voix

Femme, homme et même enfant, la bibliothèque de voix est vaste. Le site se vante de proposer plus de 75 langues et 100 dialectes pour un total de près de 1000 voix différentes. Sur certaines voix, Fliki ajoute un “style” général : joyeux, triste, criée, chuchotée… 

En français, la qualité va de Siri à des personnages de dessin animé. Si vous cherchez à être très réaliste, le choix se réduit fortement, surtout si vous voulez éviter la petite pointe d’accent canadien décelée dans certaines voix. Par contre, vous pouvez rechercher spécifiquement des voix qui "sonnent" belge, suisse ou canadien.

Même les voix les plus synthétiques dans le rendu sont construites sur la base des “neural voices” (voix neurales), une technologie qui vise à reproduire les nuances de la parole humaine.

Fonctionnalité ultime : la possibilité de cloner votre voix. Ici aussi, Fliki donne dans la simplicité : vous enregistrez 2 minutes de votre voix sur la plateforme puis vous attendez que votre échantillon soit traité et validé. Quand votre nom apparaît dans la liste des voix utilisables, il ne vous reste plus qu’à la sélectionner pour créer des voix off sur mesure.

Voix off, dialogue, podcast et même audiobook, à vous de choisir ce que vous allez publier aujourd’hui. Il va vous falloir un peu de temps mais certainement moins que si vous deviez enregistrer et traiter votre propre voix.

Text-to-video

Vous avez votre texte et vous avez votre voix, il ne reste plus qu’à illustrer vos propos et à générer une vidéo qui sera diffusée ensuite sur votre réseaux sociaux, votre blog ou vos sites web.

La génération de la vidéo démarre avec les mêmes outils que le traitement de voix. Votre écran est divisé en trois parties : à gauche l’espace pour le texte, au centre l’espace de visionnage et à droite un espace pour sélectionner les valeurs de quelques options.

Pour la création de vidéo, vous allez pouvoir choisir vos propres sources ou des ressources libres de droits. Il est bien entendu possible d’importer des photos auxquelles vous pourrez ensuite donner un petit mouvement. Fliki propose aussi une fonctionnalité de text-to-image à base d’une IA générative qui créera un visuel à partir de votre prompt. Bon, on ne va pas vous mentir : ce n’est pas le point fort de la plateforme et vous aurez tout intérêt à vous tourner vers des services dédiés comme Midjourney, Nightcafe.studio ou Clipdrop.co.

La fonctionnalité la plus intéressante se cache derrière un petit bouton qui apparaît lorsque vous êtes à l’étape de définition du média utiliser : le bouton “Auto Pick Media”. Fliki va alors analyser votre texte et vous proposer une vidéo adaptée. Vous aurez bien entendu la possibilité de cliquer une nouvelle fois pour obtenir une autre proposition. C’est plutôt bien fait et ça fait gagner un temps considérable.

Reste les autres éléments indispensables aux vidéos actuelles : ajout de musique à partir de sons libres de droits ou de votre propre chargement, ajout de watermark, options d’image dans l’image permettant l’incrustation d’un visuel ou d’une vidéo par dessus le reste du contenu (idéal pour un logo par exemple). 

La gestion du sous-titrage est particulièrement bien faite. Simple à utiliser, Fliki propose toutes les options nécessaires pour customiser le rendu, que ce soit pour les classiques options de polices, taille, couleur…, pour le placement dans l’image mais aussi pour le type de diffusion : mot à mot, par phrase, par paragraphe ou en mode cumulatif.

Click-to-video

Pour finir, on vous invite à tester la fonctionnalité “Auto generate next”. Fliki prend la main. À partir des séquences que vous avez déjà créées, le service vous propose de créer la suite de votre vidéo. Il vous propose un texte et une image d’illustration, les sous-titres et la voix. Les textes sont de bonne qualité et la génération d’une nouvelle scène ne prend que quelques secondes. Et bien entendu, vous aurez la possibilité de modifier le contenu proposé. On doit le reconnaître c’est assez bluffant.

Fliki.ai propose différentes formules. Vous pouvez générer gratuitement jusqu’à 5 minutes d’audio ou vidéo chaque mois en échange du logo Fliki sur vos productions. 

Voir le site et créer votre première vidéo : fliki.ai