[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [linux_var] Regex is a valid HTML parser, right?



Il giorno 24/lug/2015, alle ore 10:05, Gianni Carabelli <giannicarabelli@gmail.com> ha scritto:
> Io mi son spesso trovato male con un XML parser, perchè molti siti non sono XML compliant, a volte neanche HTML compliant.
> Ora controllo anche Beautiful Soup, sembra interessante..
Usare parser nati per XML sulle pagine web è, ai fini pratici, totalmente impensabile.

Rinforzo il consiglio per BeautifulSoup (e similari, nokogiri mi sembra appartenere alla stessa famiglia ma per ruby) a cui ho lanciato contro le peggio cose e ne è sempre uscito alla grande :)

--
Luca Lesinigo

_______________________________________________
Talking mailing list
Talking@ml.linuxvar.it
http://ml.linuxvar.it/cgi-bin/mailman/listinfo/talking