Listă (catalog) firme din România

Iti faci cont pe portal.onrc.ro. Contractul se decarca de acolo si platesti o taxa initiala.
Apoi datele se iau de pe API-ul postat de mine mai sus atata timo cat ai bani in contul ONRC ca sa platesti costurile verificarilor.

Aceste date (obtinute prin “API”-ul onrc) nu-s acelasi cu cele de pe site-ul data.gov.ro? http://data.gov.ro/organization/onrc

Inca cateva surse de date:

^ majoritatea sunt protejate cu captcha :frowning:

@navaru - foarte fain site-ul de openapi.ro. Stii cumva oamenii din spate? Poate merita invitati la discutie…

Cautarile gratuite, da. Sunt aceleasi date. Daca doresti constatorul digital care contine mult mai multe informatii inclusiv despre asociati si administratori (exact ca cel pe care il iei pe hartie, fizic), atunci acele interogari costa.

Eu i-am notificat, să vedem dacă sunt dornici de discuții pe această temă :slight_smile:

E interesant cat interes s-a starnit. Sunt curios la ce va duce.

Cei de genul vrajitorul.eu, listafirme.ro si risco fac deja ceva asemanator.

Personal imi place la listafirme faptul ca ai un grafic cu CA si cu profitul. Mereu m-a interesat sa aflu mai multe - insa atunci cand am cautat eu - singura solutie era sa cumperi constatatoare de la ONRC - ceea ce cred ca fac acei furnizori - cumpara in masa ca apoi sa aiba acces la date.

In sensul ca pe mfinante sunt mai putine date decat in constatator.

Si pe mine intereseaza proiectul si chiar sa fie sustenabil - nu merg neaparat pe a fi free daca exista multe costuri in spate - asta daca ne intereseaza un termen mediu si lung :slight_smile:

Se va organiza in Octombrie un Hackaton pe o tema similara cu discutia curenta:

3 Likes

Salut,

Scuze pentru raspunsul intarziat, am fost ocupat tocmai cu openapi.ro.

Sa încep cu un scurt istoric. Openapi.ro a fost extras din factureaza.ro, undeva prin 2010, primul API oferit fiind cel de informatii despre firme. Initial am folosit mai multe surse de date (mfinante, vies si onrc), dar cu timpul a ramas doar mfinante ca sursa viabila de date. Serviciul a fost oferit gratuit si fara autentificare, deci s-au gasit multi care pur si simplu au pus un crawler sa ia toate CIF-urile de la 1-10000000000, suprasolicitandu-ne serverul. Ca sa rezolvam, am pus si un rate limit de 1000req/ora. In timp am mai adaugat alte servicii (geolocare IP cu baza de date free de la maxmind, curs valutar, validare cnp/cif, coduri postale etc), dar serviciu de informatii firme a ramas pe departe cel mai mare mancator de timp (dar si cel mai util). Partea de crawling la mfinante ne-a dat suficienta bataie de cap si am lucrat la openapi mult mai mult decat am fi vrut (vezi captcha mfinante, apoi tot felul de alte obstacole, dupa un timp am ajuns sa folosim phantomjs). In fine, candva prin 2014 (daca tin bine minte) cei de la mfinante ne-au limitat numarul de req/zi undeva la 300-400 si baza de date a inceput sa se degradeze incet dar sigur, adica sa contina date din ce in ce mai vechi.

Fast forward 2016, undeva prin martie am inceput sa rescriu totul de la zero, si am integrat si alte surse de date (in mod notabil data.gov.ro). Prin mai am dat drumu crawlerului, si candva prin iulie-august am dat drumu la un beta. La inceputul lui august, m-am inhaitat si cu bunul meu prieten Paul, si am lucrat impreuna la diverse imbunatatiri. Ieri am avut un soft-launch si am anuntat preturi (API-ul vechi a fost mutat pe https://legacy.openapi.ro, si va ramane disponibil o vreme).

Alte detalii gasiti pe site, documentatie detaliata gasiti aici: http://docs.openapiro.apiary.io

Probabil ca unii dintre voi sunt dezamagiti ca am decis sa facem serviciu platit, dar credem ca e cea mai buna solutie si pentru noi si pentru utilizatorii openapi.ro - e singurul mod de a oferi un serviciu de incredere. Astea fiind spuse, noi dorim sa fim cat mai transparenti, si sa construim o comunitate in jurul acestui proiect. Orice sugestii sunt deci binevenite. Si nu vom incerca sa ne erijam in gardienii datelor pe care le-am adunat, deci intentionam sa publicam periodic un dump cu baza de date. Asta este unul dintre punctele in care se concretizeaza transparenta de care vorbeam.

Stiu ca partea de comunicare a fost cam precara din partea noastra, si probabil va mai fi o vreme, pentru ca suntem cu capul in cod pana terminam ce ne-am propus, dar vom incerca sa participam mai mult la discutii, poate chiar pe acest forum, sa avem un blog, social media etc - pana acum pur si simplu nu am avut timp.

6 Likes

Eu nu am nevoie decat de 2000 firme obligatoriu si alte vreo 10000 optional. Cu scriptul de mai jos (nu mai includ parsarea) iau cam 30 de firme pe zi, multe request-uri fiind respinse indiferent daca am setat cron-ul la 1, 2, 3, 4, 5 sau 6 minute.

<?php
namespace App\Lib;
use JonnyW\PhantomJs\Client as PhantomClient;
use Symfony\Component\DomCrawler\Crawler as Crawler;

class MFCrawler
{
    protected $mf_url = 'http://mfinante.ro/infocodfiscal.html';
    
    public function crawlBilant($cod, $web_an) // pentru date companie, fara al doilea parametru 
    {
        $client = PhantomClient::getInstance();
        $client->getEngine()->setPath('bin/phantomjs');// phantomjs.exe pentru windows
        
        $request = $client->getMessageFactory()->createCaptureRequest($this->mf_url, 'POST');
        $request->setDelay(10);
        $request->setTimeout(90000);
        $request->setRequestData(array('cod' => $cod, 'an' => $web_an, 'method.bilant' => 'VIZUALIZARE', 'captcha' => 'null'));
        
        $response = $client->getMessageFactory()->createResponse();
        
        $client->send($request, $response);
        
        if($response->getStatus() === 200)
        {
            $crawler = new Crawler($response->getContent());
            
            // ...extrage datele
        }
    }
}
4 Likes

Salut,
aveti idee cum as putea obtine codul CAEN al firmelor? In API-ul celor de la ONRC acesta nu apare.

Multumesc!

Informația aceasta apare în openAPI.

Uite aici documentația: http://docs.openapiro.apiary.io/#reference/informatii-despre-companii/bilanturi/bilanturi-listare.

1 Like

Am gasit : https://termene.ro/

1 Like

Salut, sunt interesat sa cumpar o baza de data ce sa contina si detaliile de contact cam ca la listafirme.ro.
Ma intereseaza baza de date din CUI, telefon, email. Cu stima

Salut,
Lucrez pe un proiect similar -

Lucram pe o solutie enterprise care permite interogarea anaf.ro / onrc.ro si obtinem o multime de informatii

  • registrul BPI
  • tva inactiv
  • mfinante ( bilanturi )
  • vies
    si inca 2-3 directoare similare , urmand sa mai integram ( suntem in development ) :slight_smile:

Folosim OCR-uri pentru captcha, facem screenshot-uri la raspunsurile venite din ANAF / ONRC.

Concluzia e - se poate face si mai mult ca sigur mai sunt si altii care au informatiile astea, dar conteaza si ce informatii te intereseaza.
Eu cel putin nu gasesc nicaieri adrese de e-mail asociate cu companiile ( si am o lista de 2.8 mil de companii incepand cu 1991, parca).

Daca vrei informatiile astea, cel mai bine e sa vorbesti cu cineva specializat.
openapi.ro de exemplu o sa iti ofere informatia despre un CUI, dar nu o sa iti puna ei la dispozitie o lista de CUI-uri :slight_smile:

Listafirme.ro, risco.ro si chiar si onrc iti ofera contra-cost informatii

http://www.bpi.ro/index.php/ro/tarife-bpi/furnizare-bpi

Oricum, informatia costa… Fie investesti timp si faci web-scrapping pe site-uri, fie cumperi listele gata procesate din alte surse.

Daca gasesti “bajeti” pe internet care iti vand ei liste, sfatul meu e sa mergi sa faci contract civil de prestare servicii in care sa specificati

  • ce informatii iti ofera ( o lsita de x coduri CUI insotite de a,b,c,d informatii aditionale)
  • un proces de validare a unor date aleatoare
  • un proces de predare a banilor / informatiei. Daca le cumperi la 10 lei bucata, si cumperi lista completa de 2.8 milioane, te cam arde la buzunar :slight_smile: Sa zicem ca gasesti lista completa la 5000E, contractezi un escrow care sa ii dea banii dupa ce ati validat informatia furnizata conform contractului.
  • specifici ce informatii NU va gasi in lista aia ( in cazul meu, eu n-am adrese de e-mail asociate si nici nu am de unde sa fac rost de ele :slight_smile: )

Informatia exista in domeniul public, deci poti sa contactezi pe oricine pentru achizitonarea ei - nu incalci legea :smiley:

2 Likes

De vreo 2 saptamani nu mai pot prelua nimic de la mfinante.

au bagat un JS care merge ca naiba, also nu mai merge pe IE nativ W7.

Ce solutie dezvoltati mai exact? Nu vreau sa reinventez roata, prefer sa platesc un serviciu bun si aia e.

Nu pot sa iti dau foarte multe detalii cu privire la produsele si serviciile oferite de client - nu stiu daca va fii un serviciu public sau nu.

Facem preluari de informatii din sursele oficiale, le servim prin REST API catre o aplicatie desktop. Toate interogarile se fac ondemand, spre deosebire de alte servicii unde infomatia e servita dintr-o baza de date proprie care e actualizata periodic.

In ceea ce priveste informatia pe care vrei tu sa o achizitonezi, daca imi dai niste detalii pot sa comunic mai departe clientului si sa vad daca ar fii dispus sa iti faca o oferta.

Simte-te liber sa ma contactezi in privat

Noroc, dar cine are idee unde pot cauta datele nume+numar de telefon? p-ru sms marketing
se poate deja este asa feluri de servicii ? Nu am nici o idee unde pot afla aceasta informatie

http://www.mfinante.gov.ro/infocodfiscal.html?cod=11054529
Gasesti aici informatiile de baza :slight_smile: