[Résolu] Problème d'encodage avec rss-synd
#1
Bonjour à tous,
je viens vous demander de l'aide concernant le tcl rss-synd au niveau des titres certains caractères
sorte d'une façon bizarre exemple: Comptes Google : phishing plus difficile à détecter.
Comment faire pour Convertir ces caractères bizarre en caractères normaux ?

Désolé pour l'explication je suis débutant.
Merci de votre aide.
Répondre Avertir
#2
Tu peux rajouter, dans la définition de ton flux, le charset du site:
tcl
"charset" "utf-8"


Répondre
#3
Salut CrazyCat,
je viens de suivre ton indication mais malheureusement sa ne fonctionne pas voici le résultat obtenu:

sans utf-8

Humble Bundle : 14 jours de jeux à petit prix

avec utf-8

Humble Bundle : 14 jours de jeux àpetit prix
Répondre Avertir
#4
C'est peut-être un autre encodage. Il faut que tu regardes dans le flux RSS

Envoyé de mon GT-I9100 en utilisant Tapatalk
Répondre
#5
 
C'est pas un autre encodage, c'est un encodage corrompu (par exemple pour avoir essayé de convertir de l'utf-8 en utf-8 en supposant par erreur que c'est de l'iso 8859-1 au départ).

On le voit bien dans cet exemple où le "à" et le "é" sont remplacés par un caractère identique : phishing plus difficile à dÃtecter
 
Répondre Avertir
#6
hm c'est bien de l'utf-8 il me semble le site c'est Gnt
Répondre Avertir
#7
 
En inspectant le code du script, on peut voir que le charset que tu spécifies est utilisé par un encoding convertto, ce qui fait que si tu as de l'utf-8 au départ et que tu spécifies charset "utf-8", tu convertis de l'utf-8 en utf-8.

Le script est en version beta depuis 2006 et le développement en est manifestement arrêté.
L'auteur avait encore dans sa todo list de faire un support "décent" pour les charsets, ce qui explique que ça ne fonctionne pas correctement.

Essaie de remplacer encoding convertfrom par encoding convertto dans le code, et vois ce que ça donne.
Répondre Avertir
#8
Bonsoir MenzAgitat,
en faite c'est déjà en encoding convertto

tcl
if {[info exists feed(charset)]} {
		set data [encoding convertto [string tolower $feed(charset)] $data]
	}



c'est dommage que le script ne soit plus à jour je le trouve vraiment excellent.
Répondre Avertir
#9
 
Je voulais dire l'inverse, remplace convertto par convertfrom
 
Répondre Avertir
#10
j'ai changé comme indiqué voici le résultat :

Google : des utilisateurs demandent à être oubliés

c'est l'enfer les entities
Répondre Avertir
#11
 
Il est aussi possible que le flux rss de GNT déclare son charset de façon incorrecte; essaie de mettre charset "iso8859-1" dans les paramètres du flux.

Remarque : laisse le convertfrom en place, le convertto n'a aucun sens et ne peut rien faire de bon.

Et puis ça n'a rien à voir avec les entités html, si on avait affaire à des entités au lieu d'un charset à la con, y'aurait aucun problème pour l'afficher correctement.
 
Répondre Avertir
#12
ah c'est bon ! faute de ma part j'ai oublier de mettre "charset" "utf-8"
résultat:
Google : des utilisateurs demandent à être oubliés

Merci beaucoup MenzAgitat & CrazyCat
Répondre Avertir
#13
 
Dans le but que d'autres personnes puissent facilement localiser la solution si elles rencontrent le même problème, pourrais-tu s'il-te-plaît renommer le sujet en "Problème de charset avec rss-synd" et ajouter "[Résolu]" au début ?
Merci d'avance.
 
Répondre Avertir
#14
Oui je cherche à le faire justement MenzAgitat je me souvient plus comment on fait Mad

Merci encore les gars ! Smile
Répondre Avertir
#15
 
Il faut garder le clic gauche enfoncé pendant quelques secondes sur le titre du thread quand tu es sur cette page : http://forum.eggdrop.fr/Scripts-TCL-f-4.html
 
Répondre Avertir


Atteindre :


Utilisateur(s) parcourant ce sujet : 1 visiteur(s)
Tchat 100% gratuit -Discutez en toute liberté