Ce modalitati folositi pentru a cauta in continutul unei pagini pe care ati vizitat-o, fara sa fiti pe acea pagina, iar pagina sa fie inchisa?

Salutare! De multe ori ma lovesc de problema ca vizitez o multime de pagini web din a caror continut retin anumite cuvinte cheie, dar cand caut mai tarziu dupa aceleasi cuvinte cheie pe Google, nu mai dau de acele pagini. La fel se intampla cu semnele de carte, nu gasesc paginile dupa acele cuvinte cheie, incat cuvantul cheie este in continut, nu in titlu.

In trecut am folosit o extensie Chrome care facea acest lucru (nu-mi mai amintec numele, desi cred ca reusesc sa o gasesc), adica indexa continutul unei pagini pe PC, care apoi permitea cautarea din browser dupa orice cuvant din acel continut.

Problema e ca acea extensie permitea stocarea unui numar limitat de caractere, cred ca 10 000, ceea ce e putin. Iar cealalta problema, am impresia ca nu indexa (sau le indexa intr-o oarecare masura) continutul paginilor care se incarcau dinamic .

Asadar, ce modalitati folositi pentru a cauta in continutul unei pagini (statice sau dinamice) pe care ati vizitat-o, careia sa-i fi fost indexat (preferabil indexare offline) intreg continutul?

Ar fi minunat daca ar permite cautarea asa cum o face Google, adica sa permita gasirea sinonimelor cuvantului cheie, in cazul in care acesta nu este gasit, care sa vina ca o optiune. Si totodata ar fi minunat daca ar permite folosirea astericsului ( * ), la fel cum o face Google, unde asterisc poate fi orice cuvant. Pe Google, asteriescul este folosit pentru a face legatura dintre cel putin 2 cuvinte care contin un al treilea cuvant sau un grup de cuvinte in mijloc

Spre exemplu: merg * munte
Asteriscul poate reprezenta aici cuvintele “la”, “catre”, “inspre” sau ca grup de cuvinte “si tot merg, si nu ma mai ajung odata la”.

Daca ma gandesc bine, existau 2 extensii Chrome care permiteau indexarea continutului si apoi cautarea, dar nicicare nu functioneau potrivit criteriilor de mai sus.



Hmm, poate o solutie ar fi o combinatie dintre HTTrack si folosirea unui program ca Agent Ransack, Everything, AstroGrep sau DocFetcher, desi pare a fi prea mare bataie de cap.

Un comentariu de aici mi-a atras atenția:

I have started doing something completely different than using bookmarks. I set up yacy on a personal, internal server at my home, which I can access from all my devices, since they are always on my wireguard vpn.

Yacy is actually a distributed search engine, but I run in ‘Robinson mode’ as a private peer, to keep it isolated, as I just want a personal search of only sites I have indexed.

Anytime I come across something of interest, I index it with yacy, using a a depth of 0 (since I only want to index that one page, not the whole site). This way, I can just go to my search site, and search for something, and anything related that I’ve indexed before pops up. I found this works way better than trying to manage bookmarks with descriptions and tags.

Also, yacy will keep a cache of the content which is great if the site ever goes offline or changes.

If I need to browse, I can go use yacy’s admin tools to see all the urls I have indexed.

I have been using this for several months and I am using this way more than I ever used my bookmarks.

3 Likes

Am uitat să precizez: eu personal folosesc Pocket premium. Are permanent library, are tag-uri, are full text search[1], are reader mode (foarte util pentru site-urile aglomerate, dar nu extrem de isteț, că se întâmpl ă destul de des să omită blocuri de cod, de exemplu).

Are chiar și dark theme, că observ că treaba asta este dealbreaker pentru tine. :smiley: :smiley:

Mai are API-uri, dacă vrei să-l integrezi cu aplicații 3rd party (e.g. să trimiți în One Note, Evernote, Obisdian etc), pentru un soi de backup.

Nu știu de ce, dar în Google Play Store abonamentul este 30 lei / an în timp ce pe site-ul Pocket este $45 / an (nu sunt sigur dacă este doar pentru că-s client vechi sau e așa pentru toată lumea :confused: ). Eu îl folosesc de 15 ani, încă de când se numea Read It Later și era disponibil doar pentru Firefox. [2]


  1. între noi fie vorba, ar putea fi un pic mai bun decât este… ↩︎

  2. pe de altă parte, la momentul respectiv firefox era singurul browser decent de pe piață, dar asta deja e altă poveste :smiley: :smiley: ↩︎

3 Likes

Iti multumesc! Hmm, ambele par a fi tari, trebuie sa le incerc! Desi, ma cam feresc de serviciile cu sincronizare online. Am patit-o o data cu semnele de carte de pe Chrome acum cativa ani. A facut sincronizare proasta, si pac, am ramas fara 40 000 de semne de carte. Am avut noroc ca am reusit sa recuperez marea majoritate navigand prin istoricul de pe contul Google, dar, crede-ma, nu mai vreau sa repet experienta.

Acum mi-am amintit ca am dat de un program care, cred, facea indexarea continutului unei pagini si permitea cautarea atat dupa cuvinte, cat si dupa cautarea automata a sinonimele acelor cuvinte. Doar ca venea impachetat sub forma unui sistem de operare.

Cand o sa gasesc programele, o sa le postez aici.

Editare:
Si sa nu fi avut tema intunecata, tot il faceam cumva :laughing:

Dupa ceva vreme am reusit sa dau de ele:

Memex avea o caracterstica (Browser History) care tinea de indexarea link-urilor din istoric, care, daca nu ma insel, a fost eliminata. Stiu ca una dintre aceste 2 versiuni o mai are, dar nu mai stiu care exact: