Mēģinu apčakarēt botu, kas kakā komentāros

Nu tā, ir vēl pāris mājaslapās palicies tā, ka taisīts viss uz pašbrūvēta, pašmocīta dzinēja. Tā kā nekādas ūberlietas tur nekad neesmu paredzējis, tad arī rezultātu parasti ir samērā vienkārši sasniegt—pietiek Google pameklēt kaut ko, kas varētu atbilst risinājumam. Šeku reku kafejnīcas Leningrad mājaslapā arī savu paštaisīto rezultātu mēģinu sasniegt un līdz kādam brīdim viss darbojās vienkārši lieliski, līdz lapa nekļuva populāra arī spameru botu aprindās. Tagad ir pa laikam nākas patīrīt no spama komentāru datubāzi.

Visu laiku spameru aizsardzība tikai veikta samērā elementāri—ieviešam vēl vienu formas lauku, kurā jautājam cilvēkam kaut kādu sakarīgu jautājumu, uz kuru tas spēj atbildēt. Nu un tā kā lapu apmeklē arī latviešu valodu neprotošie, tad, lai iztiktu bez pārpratumiem Google Translator vai kādā līdzīgā rīkā, izmantoju kā jautājumu parastu matemātisku uzdevumu, kuru tad tā arī noformēju:

<label for="parbaude">12+8=</label>
<input id="parbaude" name="parbaude" type="text">

Līdz noteiktam brīdim tas palīdzēja, bet tad tie kuņas, protams, atkoda, ka šitā es daru un sāka mācīties matemātiku. Tikām līdz pat reizināšanas uzdevumiem, bet spams vēl joprojām parādījās. Sarežģīt līdz kvantu fizikas cienīgiem vienādojumiem šķita neloģiski, tāpēc izdomāju šitādu variantu:

<label for="parbaude">&#49;&#50;&#43;&#56;&#61;</label>
<input id="parbaude" name="parbaude" type="text">

Kaut kad labu laiciņu atpakaļ biju jau dzirdējis par šo variantu, bet nekad to nebiju izmantojis, tāpēc domāju izmēģināt tagad, redzēs, kā palīdzēs. Patiesībā risinājums ir smieklīgi vienkāršs—aizstāju simbolus ar šo simbolu HTML numuriem. Pagaidām palīdz.

Varbūt kādam ir vēl kāds loģisks, bet programmatūriski ne pārāk smagnējs risinājums, kā varētu novērst spama masveida parādīšanos?

Par kodējumiem, to vēsturi un pielietošanas praktiku

Es gan tikai pavisam neilgu laiku, tomēr pacietīgi sekoju Iļjas rakstiem. Vienā no pēdējiem viņš pameta saiti uz Džoela rakstu «The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)».

For a while it seemed like that might be good enough, but programmers were complaining. “Look at all those zeros!” they said, since they were Americans and they were looking at English text which rarely used code points above U+00FF. Also they were liberal hippies in California who wanted to conserve (sneer). If they were Texans they wouldn’t have minded guzzling twice the number of bytes. But those Californian wimps couldn’t bear the idea of doubling the amount of storage it took for strings, and anyway, there were already all these doggone documents out there using various ANSI and DBCS character sets and who’s going to convert them all? Moi? For this reason alone most people decided to ignore Unicode for several years and in the meantime things got worse.

Thus was invented the brilliant concept of UTF-8. UTF-8 was another system for storing your string of Unicode code points, those magic U+ numbers, in memory using 8 bit bytes. In UTF-8, every code point from 0-127 is stored in a single byte. Only code points 128 and above are stored using 2, 3, in fact, up to 6 bytes.

Vispār tu vēl ir kaudze ar interesantām lietām, ko palasīties. Joel on Software es silti iesaku brīvos brīžos.

TinyBrowser—TinyMCE file and image upload script

Kaut kādus vairākus mēnešus cīnos ar problēmu, ka man nesanāk normāli piedabūt pie strādāšanas paštaisīto CMS darboties līdz galam (vai, pareizāk sakot—kaudzi ar pusgataviem skriptiem, kurus parasti līmēju kopā ar savām idejām).

Tad nu viens no liekākajiem klupšanas akmeņiem līdz šim bija sakarīgs bilžu un failu augšuplādes skripts. Pagaidām vienīgo ģeniālo esmu redzējis iekš jaunā WordPress, tomēr tik sarežģīti domāt es īsti nemāku, lai varētu to nozagt vai pielabot.

Līdz ar to meklēju strādājošas alternatīvas, jo skriptu vajadzēja ātri (aptuveni oktobra sākumā), bet atradās tas tikai tagad. Piedevām, manam skriptam būtu jābūt strādājošam ar TinyMCE, lai var normāli, kā baltais cilvēks drukāt tekstus.

Tā es sastapos ar TinyBrowser. Kaut gan pēc skripta versijas spriežot, tas nebūt nav jauns radījums, Google grupa ir izveidota tikai samērā nesen un sakritības dēļ šo grupu vispār atradu. Aleluja.

Areče arī viens ekrānšāviņš, un, lai jums lielāks iekāriens, pastāstīšu arī to, ka tiek atbalstīta vairāku failu vienlaicīga augšuplāde, failu pārsaukšana, bilžu rotācija un izmēra maiņas. Pēdējo pamēģināju—nav ne vainas, salīdzinot ar maniem personīgajiem eksperimentiem, izmantojot PHP bibliotēkas bilžu izmēra maiņai.

TinyMCE image upload script
TinyMCE image upload script

P.S. Tie, kas neko nesaprata, var šo ierakstu brīvi ignorēt. Es neesmu sagājis sviestā, man tikai gribējās datoriķiem palielīties, ka pats tiku ar šo problēmu galā.

Fuck me…

Divpadsmit stundas pavadīju, nodarbojoties ar sev tik ļoti netīkamo interneta aplikāciju programmēšanu. Protams, ka stundu pirms fināla, kad vajadzēja notestēt to visu uz servera, sāka norisināties datu rezerves kopiju veidošanās skripts un ftp nav pieejams. Afigetj. Toties tagad brīvi darbojos uz abiem monitoriem ar miljons teksta redaktoru logiem, jo savādāk nemaz nebūtu iespējams pastrādāt. Dievinu sevi.

Un vēl es gribētu ieteikt Google Reader izstrādātājiem ieviest filtru, ar kura palīdzību es varētu aizvākt no savas jauno ierakstu listes visu, kas saistīts ar iPorn, ekonomisko krīzi, Barcamp un kaķīšu bildēm.

Bučas, ar labunakti.

Adobe MAX 2007

Ja nu ir vēlme, tad varat palasīties un paskatīties prezentāciju failus no Adobe MAX 2007. Liels uzsvars ir tieši uz salīdzinoši jaunajām Adobe tehnoloģijām, interneta aplikācijām un programmēšanu, bet šis tas tomēr ir ļoti ļoti interesants. Žēl, ka prezentāciju faili nav pieejami pilnīgi visiem runātājiem.

Tikko pamanīju, ka tagad WordPress ienākošo saišu reģistrēšanai ir sācis izmantot Google Blog Search, interesanti, kas tad notika ar Technocrati?