Le SQLSaturday Paris est maintenant terminé, merci à tous d’être venus, et aussi à ceux qui ont participé à notre session. Je vous donne le lien de nos slides :
SQLSaturday 323 Paris 2014 – HDInsight
Ainsi que les fichiers sources et les scripts Pig et Sqoop que j’ai utilisé :
Un petit retour sur les références que j’ai données :
- 80% des données dans le monde ont été créés il y a moins de 2 ans (et c’est même 90% en réalité :p) :
https://twitter.com/Technet_France/status/509616270288101377
- Le très bon article HDFS versus Azure Blob Storage de Denny Glee (et surtout pourquoi privilégier du Blob Storage quand on utilise HDInsight) :
http://dennyglee.com/2013/03/18/why-use-blob-storage-with-hdinsight-on-azure/
- Le fait qu’on ne peut utiliser l’updatemode à Allowinsert dans Sqoop que sur Oracle aujourd’hui :
http://blog.cloudera.com/blog/2012/01/whats-new-in-apache-sqoop-1-4-0-incubating/ (paragraphe Mixed Update/Insert Import)
Voila, j’espère que la session vous aura plu et que vous aurez appris quelques trucs.
Votre commentaire