Just nu i M3-nätverket
Gå till innehåll
Jonas Jönsson

Plocka ut boksträver ur sträng.

Rekommendera Poster

Ja kör man inte egen server så får man allt vänta på den. Jag mitt dumma nöt glömde ju starta om servern :-/

 

Men jag ändrade till obegränsat nu så nu tankar det för fulla muggar. Tack!

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
Men jag ändrade till obegränsat nu så nu tankar det för fulla muggar.
Jag kollade på http://www.javisst.net/ojsan/rim.php och måste säga att din server "tuggar" väldigt långsamt. Endast drygt 47 000 ord hittils, det kommer ju ta flera timmar till!

 

Hos mig tog hela operationen max 2-3 minuter. Vad har du för server egentligen (processor, minne osv...)?

 

 

_________

TicoRoman - Anfall är bästa försvar

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

jo jag har märkt det. egendomligt.

 

jag kör ju ingen egen webbserver. kan inte det än. så jag skickar till ett konto hos Sajthotellet.

 

min egen dator är en P4 2.0 GB 512 MB DDR-ram med Apache, så den är det la inge fel på :-)

om jag startar om det blir det säkert samma sak igen men jag testar ändå. har inte bråttom :-)

 

[inlägget ändrat 2003-05-21 22:50:36 av Jonas Jönsson]

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

Okej, a ja då är det väl bara låta den jobba. :) Sajthotellet har kanske någon form av begränsning så att enskilda script inte ska ta för mycket processortid. :(

 

 

_________

TicoRoman - Anfall är bästa försvar

 

[inlägget ändrat 2003-05-21 22:54:12 av TicoRoman]

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

kan mkt väl vara så. de är lite snåla i vissa avseenden.

 

det har dock hänt nån enstaka gång tidigare att min dator kajkat ihop och blivit jätteslö, men funkat bra vid omstart. därför testade jag nu att starta om men det hjälpte inte. eller det går lite fortare nu faktiskt, men inte mkt. men jag glor på film så mig gör det inte så mkt.

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

Nu (mitt i natten) fick jag till slut lite fri tid (jobb, jobb jobb...) att ägna åt detta lilla projekt.

Som en liten godnattsaga... ;)

 

Jag har byggt vidare på Almirs kod, och förbättrat och optimerat(!). Lagt till lite felhantering, och säkerhetsgrejor (kan man aldrig ha för mycket utav).

 

Koden går nog att optimera aningens till...

Tryck på "Källkod"-länken längst ned, så kan ni välja att se källkoden även för inläsningsskriptet, och en exempelfil på hur mysql.php kan se ut.

 

Inläsningsskriptet klarar av att läsa in filer av de båda formaten, och avgör själv vilket format det är. Byt bara värde på $filnamn.

 

Om jag får tid över imorgon tänkte jag skriva ett skript som laddar ned uppdaterade ordlistor från länken jag gav, och läser in dessa direkt i databasen.

Kan man lägga up som ett cron-jobb om man har en *nix server... Eller som en schemalagd aktivitet i Windows.

 

Några av skillnaderna mot Almirs skript är:

- Man kan även använda ? istället för _

- Man kan söka efter obestämt antal tecken med %

- Resultaten listas i bokstavsordning

- Definitioner är möjliga (sök exempelvis på sp__n)

- Ett ord kan bara förekomma en gång i databasen (om det inte har olika stora/små bokstäver)

- Databasen gör skillnad på stora/små bokstäver, men inte när man söker (bara vid inläsandet av datafiler)

Detta är bra för egennamn och om man vill använda ordlistan till något annat i framtiden.

- GET-formulär istället för POST, eftersom det bara är en sträng man söker efter. Då slipper man den hemska "Skicka data igen"-sidan.

 

Frågor? Fel?

 

Länken är:

http://www.nonea.se/test/korsord

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

Nu fungerar inte sökningen på min sida. Orkar den inte med att söka igenom så många ord eller vad kan det bero på? Jag har inte ändrat någonting sedan den senast fungerade.

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

Nej, det verkar ju gå fort, så det är nog inte det som är felet...

 

Hur ser koden ut som hämtar från databasen? Det är nog snarare där felet ligger.

 

Testa att skriva ut SQL-frågan som ställs också, och kör den manuellt så får du se om den eventuellt innehåller några fel.

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

EDIT: Upptäckte nu att alla poster har fått ett radbrytningstecken efter ordet. Det är därför det inte går att söka på dem. Så det blir väl till att ladda upp skiten igen, med Cariads skript.

[inlägget ändrat 2003-05-22 18:34:12 av Jonas Jönsson]

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

Nu har jag kollat igenom applikationen lite mer detaljerat.

 

Tidigare skrev du att det var bättre att läsa in den andra filen (=klassificerade_ord.txt) eftersom den skulle inehålla alla böjningsformer osv... Det är nog tvärtom.

 

ordformer.txt innehåller 325 569 ord.

klassificerade_ord.txt innehåller ca 32 000 ord.

 

Kör man den andra efter första så läggs det in ytterligare 35 ord, vilket gör att man till slut har 325 604 ord.

 

Jag har gjort två mer eller mindre "viktiga" ändringar:

- Båda filerna läses in nu

- Man kan söka med *, ? och _

 

Källkod: http://cerimagic.no-ip.com/korsord2/

 

Sedan gillar jag din idé om automatiska uppdateringar. Det får du fixa när du hinner! Själv har jag aldrig använt mig av zlib-funktionerna så jag är väl värdelös på det. Ska testa senare (för "skojs" skull) om jag lyckas ladda ner och packa upp filen rätt. :)

 

PS. Vad sägs om att starta korsordslexikon.com som en "rolig" eforum-grej? ;)

 

_________

TicoRoman - Anfall är bästa försvar

 

[inlägget ändrat 2003-05-22 16:01:02 av TicoRoman]

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
Tidigare skrev du att det var bättre att läsa in den andra filen (=klassificerade_ord.txt) eftersom den skulle inehålla alla böjningsformer osv... Det är nog tvärtom.
Jo, jag får nog erkänna att jag tog fel där.

Men det är ju ändå bra att läsa in den, eftersom den innehåller definitioner.

 

Sedan är jag lite tveksam till användningen av * som _.

Borde inte * motsvara % (alltså obestämt antal tecken)?

 

Om du nu insisterar på att det ska motsvara _, så kan du förenkla str_replace()-anropet lite:

str_replace(array('*','?'), '_', strtolower(trim($_REQUEST['ord'])))

 

Visst, dra igång den domänen, så kan jag "hosta" (utalas på engelska) den.

Men då krävs ju lite snyggare upplägg också.

http://inexpensivedomains.com har billiga (du kanske känner till någon billigare).

 

Men man kanske vill utöka funktionaliteten till att omfatta andra saker också, så man kanske ska ta ett lite mer generellt namn?

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
Jo, jag får nog erkänna att jag tog fel där.

Men det är ju ändå bra att läsa in den, eftersom den innehåller definitioner.

Ja, visst. Den innehåller defintioner samt ytterligare 35 ord. ;) Därför läses nu _båda_ filerna in.

 

Borde inte * motsvara % (alltså obestämt antal tecken)?
Det vet jag faktiskt inte. Mkt möjligt. Nåväl, * är borta.

 

Var bara tvungen att ändra lite ;)

 

Visst, dra igång den domänen, så kan jag "hosta" (utalas på engelska) den.

Men då krävs ju lite snyggare upplägg också.

Jag kan regga domänen. Någorlunda "snygg" upplägg kan jag nog också fixa.

 

Men man kanske vill utöka funktionaliteten till att omfatta andra saker också, så man kanske ska ta ett lite mer generellt namn?
Förslag?

 

_________

TicoRoman - Anfall är bästa försvar

 

[inlägget ändrat 2003-05-22 16:47:12 av TicoRoman]

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
Förslag?

Efter lite snabba sökningar så ser jag att både ordlistor.com, ordlista.com och ordlista.se är tagna.

 

ordlistor.se är däremot ledigt, det kostar dock lite mer än .com-domäner (250 kr/år att jämföra med ca 120 kr hos inexpensivedomains.com).

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
EDIT: Upptäckte nu att alla poster har fått ett radbrytningstecken efter ordet.
Konstigt, det blev inget radbrytningstecken när jag använde scriptet. Fungerade det bättre med det andra scriptet?

 

 

_________

TicoRoman - Anfall är bästa försvar

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

Well, mitt skript ger i alla fall inga radbrytningstecken i slutet... ;)

 

Jag måste säga att det här blev till en riktigt intressant och matnyttig liten tråd.

 

Almir, när vi ändå är på gång kanske vi ska dra igång en liten Eforum/PHP-sida, som är tätt integrerad med Eforums PHP-forum?

Jag har egentligen inte tid :/ , men man kan nog lära sig lite på vägen även där, och med tanke på alla intressanta tips som finns här som tyvärr inte går att lista på något bra sätt i denna version av Eforum (när kommer nästa egentligen?).

 

 

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
Well, mitt skript ger i alla fall inga radbrytningstecken i slutet... ;)
;P

 

Almir, när vi ändå är på gång kanske vi ska dra igång en liten Eforum/PHP-sida, som är tätt integrerad med Eforums PHP-forum?
Låter som en intressant idé. Problemet är att jag inte heller har tid nu. Jag åker på semester om ca tre veckor (13 juni), och är borta i drygt 2 månader. Så vi får senarelägga idén till hösten helt enkelt.

 

när kommer nästa egentligen?
Ingen aning. eForum verkar tyvärr inte vara särskilt högprioriterat av IDG.

 

 

_________

TicoRoman - Anfall är bästa försvar

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
ordlistor.se är däremot ledigt, det kostar dock lite mer än .com-domäner (250 kr/år att jämföra med ca 120 kr hos inexpensivedomains.com).
250 kr är okej.

 

Jag fick en till idé idag. Man kan ju faktiskt utöka "ordlistan" med flera andra språk, tex engelska, tyska, mfl om det går att hitta (det borde det göra) en ordlista för de språken. Då kanske en mer internationellt namn skulle passa bättre?

 

Sedan kan man faktiskt göra en stavningskontroll för webbsidor, utifrån dessa ordlistor. De flesta har iofs MS Words s.kontroll, men vår skulle tex kunna "parsa" webbsidorna online och presentera webbsidan med markerade felaktiga ord. Kanske även förslag på möjliga ord, istället för de felaktiga. (någon form av smart algoritm kan man kanske göra).

 

På sikt kan man kanske även erbjuda en proffesionell (fler funktioner) betaltjänst.

 

Hittar man en synonymordlista (stavning?), så kan man... Möjligheterna är oändliga. Vi kanske blir berömda till slut. :)

 

_________

TicoRoman - Anfall är bästa försvar

 

[inlägget ändrat 2003-05-22 20:10:04 av TicoRoman]

[inlägget ändrat 2003-05-23 00:00:07 av TicoRoman]

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
Fungerade det bättre med det andra scriptet?

 

Det fungerade alldeles utmärkt! :-) Men mitt konto är fullt, jäkla skit. Just nu har jag övertrasserat några MB. Får se vad de tycker om det.

 

Får också säga att era idéer om sajt verkar roliga, även om Ticos storhetsvansinne verkar vara i kraftigaste laget ;-)

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
Almir, när vi ändå är på gång kanske vi ska dra igång en liten Eforum/PHP-sida, som är tätt integrerad med Eforums PHP-forum?

Count me in on that. Men inte heller jag har så mycket tid just nu pga att jag sitter ute hos kund och faktiskt har jobb igen! :)

 

Lite tid har man ju dock på kvällen... Jag är gärna med på en sån grej om ni går med på det!

 

--

Some say I am crazy.. but the Voices in my head disagree...

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

Hmm...

Synonymfunktion ska tillkomma på "Den stora svenska ordlistan" tror jag.

 

Grejen är den att denna ordlista ges uder en "Share alike"-licens, vilket betyder att man måste dela med sig av informationen till alla (inte källkoden, men väl databasen). Jag har inte lusläst licensen, men ungefär så ligger det till.

 

Sedan finns det redan en massa professionella språkverktyg (som Wordfinder osv) så jag tror det är svårt att ta sig in på den marknaden och tjäna pengar.

Användare är i regel ganska konservativa också...

 

Men en gratistjänst med fri källkod tycker jag låter bra. Då kan andra sätta upp egna sidor som speglar vår, och på så sätt kan man minska belastningen på servern rejält.

 

Problemet med att rättstava HTML-kod är delvis att du måste bryta ut och särskilja märkorden från brödtexten, samt att du ska markera orden på ett bra sätt.

Tänk dig att vi använder gul som bakgrund, och svart som förgrund, och så är det just detta som används på sidan. Då kommer man inte se vilka ord som är markerade.

 

Jag tror inte heller att användningsområdet för endast en stavningskontrollerande funktion, när de flesta fel som finns på webbsidor i dagsläget är gramatiska, och det är betydligt mer komplicerat att programmera.

 

Internationella ordlistor finns redan, och jag tror man gör det för krångligt för besökare om man skriver på engelska eller har fler språkval.

 

Jag tror mer på en svensk, enkel, och användbar webbplats där man kan söka efter synonymer, ord, korsords-ord och även som ett rimmlexikon (så får Jonas lite konkurrens också).

Möjligen lite fler specifika sökfunktioner.

 

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

Nja, jag vet inte riktigt...

Almir och jag måste nog snacka igenom det lite innan vi går med på det.

Du och jag har ju lite olika åsikter ibland när det gäller bra programmering (eller obra i ditt fall då)... ;)

 

Nej, allvarligt talat...

Vi kan skissa lite på hur idén kan se ut.

 

Sett/använt Denim:

http://guir.berkeley.edu/projects/denim/

 

Annars brukar jag göra en enkel skiss i Visio.

 

Vi vill ju ha en lista med senaste inlägg bara från PHP-forumet på Eforum. Det går ju tyvärr inte i dagsläget med Eriks RSS-sida.

Har du några tips på hur man kan lösa det (utan alltför stor serverbelastning)?

 

Kanske man skulle kunna ha en liten modul där besökare kan lägga upp sina programmeringsprojekt, med (delar av) källkoden, så kan man se helheten och hjälpa direkt utifrån den, och slippa ställa följdfrågor.

 

En tips-sektion är givet, och lika så länkar.

Fler förslag?

 

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
Nja, jag vet inte riktigt...

Almir och jag måste nog snacka igenom det lite innan vi går med på det.

Du och jag har ju lite olika åsikter ibland när det gäller bra programmering (eller obra i ditt fall då)... ;)

HAHA, tack för den!! :) Nog för att våra åsikter går isär ibland, men det tror jag bara är bra om man jobbar ihop, på så sätt kan man diskutera koden och komma fram till det som troligen blir en skitbra kod istället.

 

Sett/använt Denim

Aldrig sett faktiskt, intressant! Själv skissar jag inte fram hemsidor då jag gör det, mest för att jag själv inte är nån som håller på med sånt yrkesmässigt, men det ser ju smart ut att göra om vi ska kunna planera ihop en sajt allihopa tillsammans!

 

Vi vill ju ha en lista med senaste inlägg bara från PHP-forumet på Eforum. Det går ju tyvärr inte i dagsläget med Eriks RSS-sida.

Har du några tips på hur man kan lösa det (utan alltför stor serverbelastning)?

En lösning kan vara att parsa //eforum.idg.se/Threads.asp?list=a&forumid=338. Detta lär dock ge bra mycket mer belastning än att bara parsa RSS.... Om vi offrar lite öl eller liknande till Erik så kanske han kan fixa en annan RSS feed oxå? :)

 

Kanske man skulle kunna ha en liten modul där besökare kan lägga upp sina programmeringsprojekt, med (delar av) källkoden, så kan man se helheten och hjälpa direkt utifrån den, och slippa ställa följdfrågor.

Absolut!

 

En tips-sektion är givet, och lika så länkar.

Absolut även här, och självklart en sektion där bra trådar från Eforum sparas. Detta bör även extendas till att ge enskilda användare möjligheten att spara länkar till trådar som den personen tycker är värda att spara.

 

Mer idéer kommer... måste bara ta en liten paus från datorn...

 

--

Some say I am crazy.. but the Voices in my head disagree...

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

Du har rätt angående att de flesta språkfelen är grammatiska, och därmed mycket svåra om inte omöjliga att upptäcka med en algoritm.

 

Något som jag alltid tyckt skulle vara användbart är en "alfapet-lexikon", men en sådan är nog inte genomförbar. Svårigheten att i tid få dit alla ord som redan finns på 'spelbrädan' och vilka bokstäver man förfogar över torde vara omöjligt. Det är bara en intressant idé som sagt, om än ogenomförbar. :)

 

Nåväl vi kör på korsordslexikon och rimlexikon till att börja med, på http://ordlistor.se. Känner du till något företag som registrerar se-domäner men som inte tar en förmögenhet i uppläggningsavgift. Sånt har jag inte råd med. ;)

 

 

_________

TicoRoman - Anfall är bästa försvar

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Skapa ett nytt konto på vårt forum. Det är lätt!

Registrera ett nytt konto

Logga in

Redan medlem? Logga in här.

Logga in nu



×
×
  • Skapa nytt...