Existem muitas fontes que fornecem os dados históricos do estoque, mas eles fornecem apenas os campos OHLC junto com o volume e o fechamento ajustado. Além disso, algumas fontes que encontrei fornecem conjuntos de dados de capitalização de mercado, mas eles estão restritos a ações dos EUA. O Yahoo Finance fornece esses dados online, mas não há opção de baixá-los (ou nenhuma que eu conheça).
- Onde posso baixar esses dados para ações pertencentes a várias bolsas de valores em vários países usando seu nome de cotação?
- Há alguma maneira de baixá-los via Yahoo Finance ou Google Finance?
Preciso dos dados da última década ou mais e, portanto, preciso de algum script ou API que faça isso.
Resposta
Quant SE é o melhor lugar para perguntas relacionadas à obtenção de dados financeiros:
Resposta
Quanto à coleta de dados, você pode verificar Quandl (há um tutorial sobre como usá-lo com R em DataCamp se você estiver interessado).
Além disso, Aswath Damodaran” s s ite contém muitos conjuntos de dados úteis. Embora não sejam atualizados com tanta frequência, eles ainda podem ser úteis, especialmente como uma referência para comparar sua própria saída (a partir dos scripts que você inevitavelmente precisará escrever para calcular as métricas necessárias).
E, novamente, Quant SE é provavelmente um lugar melhor para se procurar …
Resposta
Este site lista capitalizações históricas de mercado e valores empresariais para empresas S & P 100 e NASDAQ-100 nos últimos 10 anos. Você pode exportar os conjuntos de dados para o Excel.
http://marketcapitalizations.com/historical-data/historical-data-categories/valuations/
Você também pode tentar contatá-los para obter dados por um período mais longo.
Comentários
- Você é afiliado a este site, BTW?
Resposta
Eu faria desta forma.
import requests from bs4 import BeautifulSoup base_url = "https://finviz.com/screener.ashx?v=152&s=ta_topgainers&o=price&c=1,2,6,7,25,65,67" html = requests.get(base_url) soup = BeautifulSoup(html.content, "html.parser") main_div = soup.find("div", attrs = {"id":"screener-content"}) light_rows = main_div.find_all("tr", class_="table-light-row-cp") dark_rows = main_div.find_all("tr", class_="table-dark-row-cp") data = [] for rows_set in (light_rows, dark_rows): for row in rows_set: row_data = [] for cell in row.find_all("td"): val = cell.a.get_text() row_data.append(val) data.append(row_data) # sort rows to maintain original order data.sort(key=lambda x: int(x[0])) import pandas pandas.DataFrame(data).to_csv("AAA.csv", header=False)