Zeichensatz aus Datei [ERLEDIGT]
Moderator: Moderatoren
- Koverhage
- Der Entwickler von "Deep Thought"
- Beiträge: 2471
- Registriert: Fr, 23. Dez 2005 8:00
- Wohnort: Aalen
- Hat sich bedankt: 102 Mal
- Danksagung erhalten: 3 Mal
- Kontaktdaten:
Zeichensatz aus Datei [ERLEDIGT]
Habe bei der Suche nichts gescheites gefunden.
Ich muss des Öfteren Textdateien einlesen.
Normalerweise enthalten die DOS/OEM oder WIN/ANSI Zeichensätze.
Jetzt habe ich eine Datei die mit einem DOS Editor Mit Windows Editor (ANSI Zeichensatz)
Müller
Mit Ultra Edit
Müller (wenn ich das hier einfüge, Original wie Bild)
Ich muss des Öfteren Textdateien einlesen.
Normalerweise enthalten die DOS/OEM oder WIN/ANSI Zeichensätze.
Jetzt habe ich eine Datei die mit einem DOS Editor Mit Windows Editor (ANSI Zeichensatz)
Müller
Mit Ultra Edit
Müller (wenn ich das hier einfüge, Original wie Bild)
- Dateianhänge
-
- Mit Ulra Edit
- 2020-02-06_170710.jpg (2.21 KiB) 8170 mal betrachtet
Zuletzt geändert von Koverhage am Fr, 07. Feb 2020 8:10, insgesamt 2-mal geändert.
Gruß
Klaus
Klaus
- brandelh
- Foren-Moderator
- Beiträge: 15699
- Registriert: Mo, 23. Jan 2006 20:54
- Wohnort: Germersheim
- Hat sich bedankt: 68 Mal
- Danksagung erhalten: 34 Mal
- Kontaktdaten:
Re: Zeichensatz aus Datei
das sieht für mich nach UTF8 kodiertem Text aus, einfach mal umsetzen was passiert.
PS: mit Notepad+ kann man alle möglichen Dateien öffnen und dann nachsehen welcher Zeichensatz verwendet wird (unter Codierung).
PS: mit Notepad+ kann man alle möglichen Dateien öffnen und dann nachsehen welcher Zeichensatz verwendet wird (unter Codierung).
Gruß
Hubert
Hubert
- Koverhage
- Der Entwickler von "Deep Thought"
- Beiträge: 2471
- Registriert: Fr, 23. Dez 2005 8:00
- Wohnort: Aalen
- Hat sich bedankt: 102 Mal
- Danksagung erhalten: 3 Mal
- Kontaktdaten:
Re: Zeichensatz aus Datei
Danke, sehr hilfreich. Musste zwar ein wenig suchen weil bei mir Kodierung steht
Gruß
Klaus
Klaus
- Koverhage
- Der Entwickler von "Deep Thought"
- Beiträge: 2471
- Registriert: Fr, 23. Dez 2005 8:00
- Wohnort: Aalen
- Hat sich bedankt: 102 Mal
- Danksagung erhalten: 3 Mal
- Kontaktdaten:
Re: Zeichensatz aus Datei [ERLEDIGT]
Da müsste ich mir ja mal den Quellcode ziehen. Die Funktion zum Feststellen des Zeichensatzes könnte für mich sehr hilfreich sein.
Gruß
Klaus
Klaus
- Marcus Herz
- 1000 working lines a day
- Beiträge: 858
- Registriert: Mo, 16. Jan 2006 8:13
- Wohnort: Allgäu
- Hat sich bedankt: 39 Mal
- Danksagung erhalten: 192 Mal
- Kontaktdaten:
Re: Zeichensatz aus Datei [ERLEDIGT]
"Echte" Unicode Dateien haben einen Offset am Anfang, den clevere Editoren ausblenden (z.B. Notepad) aber den Zeichensatz erkennen:
UFT8:  xEF BB BF
UTF16;ÿþ xFF FE
oder
þÿ xFE FF
Man sieht das z.B. bei Combit LST Dateien am Anfang: sind UTF 8 Codiert
UFT8:  xEF BB BF
UTF16;ÿþ xFF FE
oder
þÿ xFE FF
Man sieht das z.B. bei Combit LST Dateien am Anfang: sind UTF 8 Codiert
Gruß Marcus
Den Kopf in den Sand zu stecken verbessert die Welt auch nicht.
Den Kopf in den Sand zu stecken verbessert die Welt auch nicht.
- Jan
- Marvin
- Beiträge: 14659
- Registriert: Fr, 23. Sep 2005 18:23
- Wohnort: 49328 Melle
- Hat sich bedankt: 21 Mal
- Danksagung erhalten: 88 Mal
- Kontaktdaten:
Re: Zeichensatz aus Datei [ERLEDIGT]
BOM = Byte Order Mark
Machen aber dummerweise nicht alle Programme, ist also kein absolut sicheres Zeichen.
Jan
Machen aber dummerweise nicht alle Programme, ist also kein absolut sicheres Zeichen.
Jan
Mitglied der XUG Osnabrück
Mitglied der XUG Berlin/Brandenburg
Mitglied des Deutschsprachige Xbase-Entwickler e. V.
Mitglied der XUG Berlin/Brandenburg
Mitglied des Deutschsprachige Xbase-Entwickler e. V.
- Koverhage
- Der Entwickler von "Deep Thought"
- Beiträge: 2471
- Registriert: Fr, 23. Dez 2005 8:00
- Wohnort: Aalen
- Hat sich bedankt: 102 Mal
- Danksagung erhalten: 3 Mal
- Kontaktdaten:
Re: Zeichensatz aus Datei [ERLEDIGT]
Ich mache das jetzt so
Erst prüfe ich auf chr(195)
Wenn vorhanden dann auf
195+159 usw.
das reicht erstmal für meine Zwecke aus
Erst prüfe ich auf chr(195)
Wenn vorhanden dann auf
195+159 usw.
das reicht erstmal für meine Zwecke aus
Gruß
Klaus
Klaus
- brandelh
- Foren-Moderator
- Beiträge: 15699
- Registriert: Mo, 23. Jan 2006 20:54
- Wohnort: Germersheim
- Hat sich bedankt: 68 Mal
- Danksagung erhalten: 34 Mal
- Kontaktdaten:
Re: Zeichensatz aus Datei [ERLEDIGT]
Wenn die Dateien von Linux, Unix oder Apple kommen können, muss man den Zeilen Trenner abfragen, so wie ich in meiner HBTextReader() Klasse:
Die Reihenfolge der Byte Order hängt vom Betriebssystem bzw. auch vom Prozessor ab.
Code: Alles auswählen
METHOD HBTxtReader:IsCrLf()
RETURN (::cCRLF == chr(13)+chr(10))
METHOD HBTxtReader:IsUnix()
RETURN (::cCRLF == chr(10))
METHOD HBTxtReader:IsMac()
RETURN (::cCRLF == chr(13))
Gruß
Hubert
Hubert
-
- Rekursionen-Architekt
- Beiträge: 159
- Registriert: So, 16. Apr 2006 11:12
- Wohnort: Öhringen
Re: Zeichensatz aus Datei [ERLEDIGT]
Hallo
Ich mache aktuell viel über XML (UTF8) und da auch immer das Problem mit den doppelten Character pro zeichen.
Hab jetzt mal einen Versuch mit UTF82Char() (xBase 2.0) gemacht und das sieht ganz gut aus.
Gruß
Bernd
Ich mache aktuell viel über XML (UTF8) und da auch immer das Problem mit den doppelten Character pro zeichen.
Hab jetzt mal einen Versuch mit UTF82Char() (xBase 2.0) gemacht und das sieht ganz gut aus.
Gruß
Bernd
Bernd Reinhardt
fa.reinhardt@gmx.de
fa.reinhardt@gmx.de