Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Repositório exclusivo para conter cópia de dados que hoje estão em EticaAI-linguistic-datasets-pt/data/ #5

Closed
fititnt opened this issue Dec 3, 2020 · 2 comments

Comments

@fititnt
Copy link
Member

fititnt commented Dec 3, 2020

Atualmente o diretório data/ tem informações de demonstração. Porém a tendência é que, mesmo que os conjuntos de dados tendam a ser pequenos, eventualmente eles podem ficar bem grandes (mesmo que seja por acidente) e isso pode começar a deixar pesado para quem for fazer git clone deste repositório. Outro problema é que eventualmente pode haver automação em como esses dados são gerados, e a quantidade de alterações feitas em nome de humanos poderia gerar muito ruído.

Situação atual

Captura de tela de 2020-12-03 12-35-14
Captura de tela de 2020-12-03 12-35-29

Proposta: criar repositório apenas para dados

Talvez a melhor alternativa (pelo menos enquanto não usar outros lugares para armazenar dados) seja ter um repositório apenas para isso.

Porém indicar fortemente no repositório que, para fins de documentação e fins de "onde estão os scripts" apontar para esse projeto

fititnt added a commit that referenced this issue Dec 3, 2020
…tasets-pt-data (#5):

bin/translate-readme: [PT] v2.0 v2.0; abre navegador em vez de usar translate-shell
bin/save-files: [PT] Arquivos de data/ agora são salvos em EticaAI-linguistic-datasets-pt-data
@fititnt
Copy link
Member Author

fititnt commented Dec 3, 2020


Captura de tela de 2020-12-03 13-46-31

Captura de tela de 2020-12-03 13-49-20


Captura de tela de 2020-12-03 13-49-53


Captura de tela de 2020-12-03 14-05-17

@fititnt
Copy link
Member Author

fititnt commented Dec 3, 2020

Feito. Quando necessário ter uma cópia local, o repositório usado será o https://github.com/EticaAI/EticaAI-linguistic-datasets-pt-data.

Em geral, mesmo enquanto não houver alguma automação para fazer commits automáticos, vamos usar como e-mail "bot[at]etica.ai" e nome "Etica.AI (bot) na conta.

O domínio usado para servir o conteúdo (talvez seja alterado no futuro) é o https://data-pt.etica.ai

@fititnt fititnt closed this as completed Dec 3, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant