Just nu i M3-nätverket
Gå till innehåll

Formatering i oformaterad textfil


ChristerE
 Share

Go to solution Solved by ChristerE,

Rekommendera Poster

Kan någon förklara hur text i en ren textfil (.txt) läst med Notepad kan se formaterad ut, se bilder nedan.


Det kom ett mejl häromdagen som såg skumt ut. Läste det därför som oformaterad text för säkerhets skull, i Outlook. Jag använder inte förhandsvisning av mejlen, bl a för att undvika att visa formaterat innehåll, så snart Outlook startas.


Men en rad i mejlet såg ändå ut att vara formaterad, mellanraden i bilden.

1251246051_Frnmejlet.JPG.099f5756fa2243db307a8f4e8eccd70e.JPG

 

Kopierade några rader och klistrade in i en .txt-fil, och blev förvånad. Där tycker jag formateringen är ännu tydligare.

143213160_Frntxt-fil.JPG.25b6c8f4c912e1d0245011b953d5eb92.JPG

 

Mejlet är ett utpressningsmejl (rätt uppenbart antar jag), så jag funderade på om någon ljusskygg typ känner till någon "illasinnad kod" som kan "gömmas" i oformaterad text och sen i textfiler, som fick texten att se formaterad ut.


Vet inte vad andra skulle kunna göra med textsträngen (adressen), men jag suddade i alla fall en del tecken "för säkerhets skull".


Googlade för att eventuellt hitta något om "formaterad oformaterad textfil". Hittade bl a följande som beskriver att ingen formatering kan göras i en ren textfil. Formatering kan göras, men det är inställningar i Notepad för att välja typsnitt och storlek. Den formateringen finns inte i textfilerna.

https://www.computerhope.com/issues/ch001872.htm


Realtidsskydd är förstås aktivt i antivirusprogrammet, och också aktivt i premiumversionen av Malwarebytes. Inget av dem reagerade när mejlet kom, eller när jag öppnar det (som oformaterad text). Skanningar har sen heller inte hittad något skadligt. Fast det är förstås utpressningen som avsändaren vill att man ska gå på.


Men, som sagt, var kommer formateringen från?

 

 

Länk till kommentar
Dela på andra webbplatser

Ja, det låter väldigt märkligt det du råkat ut för. Du skulle kunna prova att öppna textfilen med Notepad++ och se om det finns några dolda tecken i filen.

 

image.png.d309dca41b3b5e9d54fe76af7446bfda.png

 

Om man i Notepad++ väljer View --> Show Symbol --> Show All Characters borde det synas om det finns något i textfilen utöver den text du kan se. Kommer inte på något annat som man kan göra för att kolla upp detta ytterligare.

 

Länk till kommentar
Dela på andra webbplatser

Mr Andersson

Detta var faktiskt lite intressant, för oformaterad text är just det - oformaterad! Jag skulle vilja ha din fil för vidare "analys". Kan du skicka som memo, om det går att skicka filer där? Zippa den först så inte den förstörs på vägen. Lovar att återkomma med vad man egentligen hittat på :) 

Länk till kommentar
Dela på andra webbplatser

12 timmar sedan, skrev Automan:

Du skulle kunna prova att öppna textfilen med Notepad++ och se om det finns några dolda tecken i filen.

Tack för tipset. Programmet installerat, och mysteriet löst. Handlar om teckenkodningen som jag fattar det, UTF-8 och ANSI. Tolkar det som att adressen för bitcoinbetalningen är skriven med en teckenkodning och resten av mejlet med en annan. Och teckenkodningen kan tydligen växla inom rena textfiler.


Några dolda tecken visades inte i Notepad++, förutom radslut, men texten såg formaterad ut även i det programmet. Testade en massa varianter där jag kopierat och klistrat in på olika sätt. I Notepad och Notepad++ men även klistrat in utan format i Word (fast strängen var rimligtvis redan formatlös) följt av ny kopia av den inklistrade strängen. Klistrat in i Excel och sen kopierat från formelfältet (tror det blir utan formatering då). Men texten såg fortfarande ut att vara olika formaterad (beroende på vad som kopierats och klistrats in).


Lösningen kom när jag kollade formatmenyn i Notepad++ och testade att ändra teckenkodningen för den inklistrade text. Bitcoinadressen blev oförändrad men textraderna blev annorlunda, se bilderna.

 

Formatmenyn, med UTF-8 och ANSI.

913453770_NotepadMenyn.jpg.f59c90b509c6627f66d154be58a5325e.jpg

 

Texten inklistrad i Notepad++, koll i Formatmenyn visade UTF-8.

1023597288_NotepadUTF-8.JPG.3edb992eb82eaac79b09a98e2bd8eaec.JPG

 

Texten efter ändring till ANSI.

735742805_NotepadANSI.JPG.2ae02d09542e00f25a865c86efc670f4.JPG

 

Varför teckenkodningen skulle vara olika i mejlet (om min tolkning stämmer) vet jag inte. Kanske något i samband med kopia av strängen för att hantera betalningen. Att textraderna verkade vara olika formaterade måste ha berott på de olika teckenkoderna.

 

 

6 timmar sedan, skrev Mr Andersson:

Detta var faktiskt lite intressant, för oformaterad text är just det - oformaterad! Jag skulle vilja ha din fil för vidare "analys".

Tack för erbjudandet, men problemet är som synes löst. Hittade i alla fall något som skiljer raderna åt även om mitt resonemang kanske har svagheter.
 

  • Tack 1
Länk till kommentar
Dela på andra webbplatser

Mr Andersson
25 minuter sedan, skrev ChristerE:

Tack för erbjudandet, men problemet är som synes löst. 

Jag skulle ändå vilja kolla på det själv också, om det är ok för dig?

Länk till kommentar
Dela på andra webbplatser

  • Solution
På 2020-04-28 på 21:10, skrev ChristerE:

Hittade i alla fall något som skiljer raderna åt även om mitt resonemang kanske har svagheter.

Tror resonemanget har "svagheter". Vid koll under Format visades först UTF-8, vilket väl rimligtvis avser hela texten. Och växling till ANSI bör ju också avse hela texten, så att teckenkodningen växlar inne i filen kan ju inte stämma. Det är filens innehåll som presenteras på olika sätt i Notepad++ när man växlar mellan teckenkodningarna. Innehållet i filen avser UTF-8 och måste därför tolkas med avseende på UTF-8 för att innehållet ska vara läsbart, liksom i mejlet jag hämtade raderna från.


Vid växling mellan teckenkodningarna så förändras inte raden med bitcoinadressen, så något i den textsträngen verkar vara "speciellt", i alla fall på något sätt lika för de två teckenkodningarna.


UTF-8 är en teckenkodning som används för att representera text kodad i Unicode. Unicode innehåller mer än 100000 tecken och innehåller tecken från många skriftsystem i världen. Den mellersta raden i exemplen i bilderna är skriven med tecken som tolkas lika oavsett UTF-8 eller ANSI. De andra två raderna måste tolkas med UTF-8 för att tecknen i filen ska bli läsbar. De olika kodintervallen (tror jag det kallas) i UTF-8 gör också att formateringen ser olika ut för de tre raderna.


https://sv.wikipedia.org/wiki/UTF-8

https://sv.wikipedia.org/wiki/Unicode


(Flyttar "LÖST" till det här inlägget.)


 

På 2020-04-28 på 21:37, skrev Mr Andersson:

Jag skulle ändå vilja kolla på det själv också, om det är ok för dig?

Var på väg att skicka filen när jag kom på tankevurpan. Så med den nya förklaringen så finns väl inget mer att komma på.

  • Gilla 1
Länk till kommentar
Dela på andra webbplatser

 Share

×
×
  • Skapa nytt...