Suchwörter   (werden UND-verknüpft)
Keines der folgenden   keine eigenen Beiträge
Name des Autors 
resp. Themenstellers 

nur dessen Startbeiträge
auch in Antworten dazu
Forum 
 Suchrichtung  Auf  Ab Suchmethode  Sendezeit Empfehlungbeta [?]
       Die Suche erfolgt nach den angegebenen Worten oder Wortteilen.   [Suchtipps]

Link auf dieses Suchergebnis hier

Forum
Thema Eingetragen
Autor

Algorithmen / Datenstrukturen
  
Thema eröffnet von: Casler
Unicode Sortierung mit Quicksort  
Beitrag No.13 im Thread
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag2020-11-28
Casler
 

Es handelt sich um eine UTF-8-Kodierung, zumindest zeigt, der Windows 10-Editor das so an. Und wenn ich mir den Hex-Code der Zeichen ansehe, so sind sie 3 Byte lang. Vielleich trifft dies nicht auf alle Unicode-Zeichen zu, aber für die von mir bisher verarbeiteten schon.
Woran erkenn ich, dass das Zeichen 4 Byte hat?
Natürlich gibt es auch kürzere, nämlich  die deutschen Umlaute, die haben nur 2 Byte und die normalen ASCII-Zeichen verwenden nur 1 Byte. Alles bekannt.

Algorithmen / Datenstrukturen
  
Thema eröffnet von: Casler
Unicode Sortierung mit Quicksort  
Beitrag No.11 im Thread
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag2020-11-27
Casler
 

Ja genau und das habe ich ja doch gemacht, siehe oben.
Mit meiner etwas antiquierten Programmiersprache funktioniert der
Quicksort für ASCII-Vergleich wunderbar.
Nun habe ich für die Unicode-Vergleich an den Stellen < oder > eigene Vergleiche angelegt, die aber nicht funktioniert haben.
Die Unicode-Zeichen sind 3 Byte lang, also muss ich auch 3 Byte zusammen untersuchen.
Nun muss ich wohl mit den 3 Byte eine eindeutige Größe suchen, vermutlich in einer noch zu erstellenden Tabelle.
Die Größe entscheidet dann ob < oder > zutrifft.

bisher hatte ich folgendes für die  <  Entscheidung:

txt1 und txt2 sind die zu vergleichenden Größen

 vt1 = 0
 vt2 = 0
 i = 0
 LT_U8 = False
 While vt1 = vt2 And i < Minimum Länge von txt1 und txt2
    i = i + 1
    vt1 = Asc(Mid(txt1, i, 1))
    vt2 = Asc(Mid(txt2, i, 1))
    If vt1 < vt2 Then
       LT_U8 = True
       Exit
    End If
    If vt1 > vt2 Then
       LT_U8 = False
       Exit
    End If
 Wend
' wenn vt1 = vt2
If n1 < n2 Then
  LT_U8 = True
End If

das liefert nur einen byteweisen Vergleich (aber scheint fehlerhaft zu sein) und auch nicht das gewünschte Ergebnis.

Algorithmen / Datenstrukturen
  
Thema eröffnet von: Casler
Unicode Sortierung mit Quicksort  
Beitrag No.8 im Thread
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag2020-11-27
Casler
 

Was meinst du hier mit Sprache ?
(Programmiersprache oder Sprachen wie Japanisch?)
und was ist im Japanischen oder Chinesischen lexikographisch?


Algorithmen / Datenstrukturen
  
Thema eröffnet von: Casler
Unicode Sortierung mit Quicksort  
Beitrag No.6 im Thread
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag2020-11-27
Casler
 

Ja danke soweit, die Beiträge mit japanischer Schrift gehen in die richtige Richtung.
Und tatsächlich konnte ich solche eine Sortierung nun auch erreichen.
Nun kommt der zweite Teil meiner Frage:
Im Japanischen oder chinesischen möchte man bei der Sortierung keine Zeichen an den oberen Stellen sehen, die eigentlich sehr selten verwendet werden.
Also muss man so etwas wie Kollation betreiben.
Meine Frage lautet nun ganz konkret: wie kann ich dem Sortieralgorithmus sagen, da wo du zwischen >,= oder < unterscheidest gilt nicht die ASCII-Reihenfolge sondern eine eigene? (Einen Sortierparameter gibts wohl nicht?)
Das klingt nach Hinterlegung einer Tabelle. Aber das kann auch das schelle Sortieren mit QuickSort stark verlangsamen.
Also geht es mir auch um eine ertragbare Geschwindigkeit beim Sortieren von sagen wir mal 200.000 Sätzen.

Algorithmen / Datenstrukturen
  
Thema eröffnet von: Casler
Unicode Sortierung mit Quicksort  
Beitrag No.2 im Thread
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag2020-11-26
Casler
 

Danke, dass du das Problem nochmal mit anderen Worten beschrieben hast.
Aber auf den Vergleich kommt es doch genau an.
Ich habe das mal mit verschiedenen Vergleichsmethoden versucht, aber keine Sortierung erhalten.
Auch ein Sort mit Excell, dem ja egal ist, was es sortiert, hat kein Ergebnis geliefert.
Oder mache ich etwas falsch ?

Algorithmen / Datenstrukturen
  
Thema eröffnet von: Casler
Unicode Sortierung mit Quicksort  
Themenstart
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag2020-11-25
Casler
 

Ich suche nach einem Algorithmus,
mit dem man Strings/Datensätze sortieren kann,
die keine ASCII sondern Unicode Zeichen enthalten. Ich benutze bisher den Quicksort, der ja ziemlich performant ist, mit zufrienstennden Ergebnissen für ASCII.
Aber mit dem Stringvergleich >= und <= habe ich doch Probleme bei Unicode.
Wer kann mir helfen?
 [Anzahl der Suchergebnisse: 6]
Link auf dieses Suchergebnis hier

 
 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2021 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]

used time 0.017495