Salutare! De multe ori ma lovesc de problema ca vizitez o multime de pagini web din a caror continut retin anumite cuvinte cheie, dar cand caut mai tarziu dupa aceleasi cuvinte cheie pe Google, nu mai dau de acele pagini. La fel se intampla cu semnele de carte, nu gasesc paginile dupa acele cuvinte cheie, incat cuvantul cheie este in continut, nu in titlu.
In trecut am folosit o extensie Chrome care facea acest lucru (nu-mi mai amintec numele, desi cred ca reusesc sa o gasesc), adica indexa continutul unei pagini pe PC, care apoi permitea cautarea din browser dupa orice cuvant din acel continut.
Problema e ca acea extensie permitea stocarea unui numar limitat de caractere, cred ca 10 000, ceea ce e putin. Iar cealalta problema, am impresia ca nu indexa (sau le indexa intr-o oarecare masura) continutul paginilor care se incarcau dinamic .
Asadar, ce modalitati folositi pentru a cauta in continutul unei pagini (statice sau dinamice) pe care ati vizitat-o, careia sa-i fi fost indexat (preferabil indexare offline) intreg continutul?
Ar fi minunat daca ar permite cautarea asa cum o face Google, adica sa permita gasirea sinonimelor cuvantului cheie, in cazul in care acesta nu este gasit, care sa vina ca o optiune. Si totodata ar fi minunat daca ar permite folosirea astericsului ( * ), la fel cum o face Google, unde asterisc poate fi orice cuvant. Pe Google, asteriescul este folosit pentru a face legatura dintre cel putin 2 cuvinte care contin un al treilea cuvant sau un grup de cuvinte in mijloc
Spre exemplu: merg * munte
Asteriscul poate reprezenta aici cuvintele “la”, “catre”, “inspre” sau ca grup de cuvinte “si tot merg, si nu ma mai ajung odata la”.
Daca ma gandesc bine, existau 2 extensii Chrome care permiteau indexarea continutului si apoi cautarea, dar nicicare nu functioneau potrivit criteriilor de mai sus.
Hmm, poate o solutie ar fi o combinatie dintre HTTrack si folosirea unui program ca Agent Ransack, Everything, AstroGrep sau DocFetcher, desi pare a fi prea mare bataie de cap.