Hoy vamos a hablar de cómo acceder a la stream API de Twitter y cómo guardar lo que nos llega en Riak, una base de datos documental.
Lo primero que necesitaremos es tener Ruby y Riak instalados, luego necesitamos las gemas tweetstream y riak-client. A continuación un breve script donde veremos lo sencillo que es:
require 'tweetstream' require 'riak' TweetStream.configure do |config| config.consumer\_key = 'my\_consumer\_key' config.consumer\_secret = 'my\_consumer\_secret' config.oauth\_token = 'my\_oauth\_token' config.oauth\_token\_secret = 'my\_oauth\_token\_secret' config.auth\_method = :oauth end client = Riak::Client.new bucket = client.bucket("anontwi") TweetStream::Client.new.track('anontwi') do |status| doc = bucket.get\_or\_new(status.object\_id) # object\_id es un mal ejemplo doc.raw\_data = status.text doc.content\_type = 'text/plain' doc.store puts "#{status.text}" end
Las credenciales de acceso a la API las tienes que solicitar en Twitter Developers creando una aplicación nueva.
Lo sugerido hasta ahora muestra que lidiar con grandes volúmenes de datos no es algo que esté solo al alcance de unos pocos grupos de trabajo, cualquiera desde su casa puede jugar con cualquier servicio y luego presentarlo como más le guste. Recomiendo echar un vistazo a D3.js, para la visualización en la web.
Si estas interesado en trabajar con estos temas pero careces de los conocimientos adecuados, en aLabs te podemos ayudar. ¡Contáctanos!