jueves, 2 de marzo de 2017

...y Amazon Web Services cayó!! con ello el IoT




El último día del mes de Febrero fue duro no solo para Amazon sino para todos sus clientes y partners.

La nube de Amazon, el corazón cloud de su negocio y el de cientos de empresas cayó el día 28 de Febrero.

Hablan de un problema de almacenamiento en uno de sus datacenter, pero la verdad es que si eso fuera así, no se habría visto afectado internet a nivel global, luego expondré mi opinión.

Las noticias recogen que fue un desastre para empresas de Estados Unidos, empresas grandes como Apple, Netflix y sus clientes sufrían problemas.

Pero ¿y en Europa? ¿y el resto de continentes?, desde el martes no he visto muchas noticias haciendo referencia al problema de empresas en nuestro área, pero el problema ha sido global y lo hemos sufrido todos más o menos sin ser conscientes de ello.

El martes a la mañana, ciertos servicios web iban lentos, hasta aquí todo normal. Wasap iba a golpes, y alguno pensábamos que era fallo de la versión móvil para Windows 10 (si, sigo disfrutando de mi Lumia 640 XL), el tráfico de internet en ciertas webs era imposible y empezaban a llegar algunas noticas del otro lado del Atlántico.

En mi caso, hacia las 15:00 me avisaron de casa, el termostato wifi momit que no hace muchos meses les instalé a mis padres, no respondía a encender la caldera desde la App móvil.
Tras unos días de estar fuera en casa, pensé que el ADSL se habría colgado, total, un reset solucionaría el problema. Pero no fue así.

Me tocó resetear el router y el termostato, todo seguía parecido, al final se hizo tarde y como de manera manual la caldera funcionaba, dejé a las máquinas descansar y esperar a otro día, pues no era de vital importancia para nosotros.

Al día siguiente, viendo noticias más concretas de Amazon, busque información, y en efecto, momit utiliza los servicios de la nube de Amazon para el IoT.
Amazon decía estar recuperada el día 1 de Marzo a primera hora de la mañana, pero a Europa esa recuperación llegó a partir de las 15:00 hora Española.
Momento en que muchas webs funcionaban correctamente, mi cacharro IoT (termostato) ya parecía responder y hacer casos a las ordenes desde la App móvil y desde la web de momit

Hasta entonces, se me había ocurrido hablar con el fabricante por ver si era un problema general relacionado con Amazon, algo de ellos o algo particular de mi cacharro

La respuesta no fue la esperada, aunque a mí me valía.

"Lamentamos cualquier inconveniente causado por nuestros dispositivos.

 Estamos trabajando en desarrollar la nueva App de momit Smart, que soluciona los problemas que puedan ocurrir con las diferentes funcionalidades del termostato (geolocalización, ambient, presence...) y mala sincronizacion entre termostato y App. .
De momento no tenemos una fecha de lanzamiento. Sin embargo le mantendremos informado para cuando la tengamos lista.

Procederemos a marcar este ticket como resuelto, de todas formas, si experimenta nuevos problemas o tiene alguna duda, no dude en contactar a este correo electrónico indicando en detalle lo que está ocurriendo.

Sentimos las molestias causadas y aprovechamos para agradecerle su confianza en nosotros.
 Saludos"
Me vienen hablando de nueva versión de App, pero ¿y desde la web que también falla? ¿seguro que no tiene que ver con AWS? ¿ni con mi ADSL?
Si que hablan de mala sincronización, en mi caso yo le pedía 21 grados y a los 30 segundos se quedaba de nuevo en 19, así con todo. Tenía visión de la web, de ciertos datos que recogía del termostato, pero en sentido web/App --> termostato, nada funcionaba.

Lo mejor de todo, fue dar el ticket como resuelto, algo que nunca entenderé y que me enciende, pero no voy a discutirlo para este caso. Ahí lo dejo.

Tras esto, envié algún email adicional, sin respuesta, pues ya habían cerrado el ticket.

Sin más, me dio mucho que pensar, no que momit no respondiera lo que yo quería oír, ni su respuesta primera, que hasta me pareció de lo mas normal y cordial.

Me dio sensación de que tenían conocimiento de algún problema, pero no de la magnitud y origen el mismo, y eso me asustó.
Digo esto, porque mi cabeza empezó a dar vueltas y ponerme en su sitio, a pensar si ellos veían todo caído, parcialmente o a ratos, si era a todos sus clientes o solo nos dimos cuenta alguno, me preguntaba si directamente ellos tienen el contrato con AWS o lo han hecho a través de un partner que les vende el servicio como suyo, a pensar si la solución del problema estaba en su parte, o en la de AWS y sobre todo, a imaginarme que, si en Estados Unidos no había muchas noticias del estado real de la nube de AWS, a ellos y a mi como clientes no nos iba a llegar nada.

Nada de información del estado, ni tiempos de recuperación, ni si funcionaron o no los planes de contingencia y alta disponibilidad (bueno, esto tengo claro que no).

Para nada, no hay ni habrá transparencia en el fallo de AWS, difícil es contabilizar realmente los servicios que se vieron afectados, excepto los de las cuatro grandes. No sabremos fácilmente si esto fue un fallo de almacenamiento, de transporte de datos o de un ataque a la nube de AWS.
Afectó teóricamente a Estados Unidos, pero el resto de continentes sufrieron cortes y degradaciones de servicio, quizás por no tener bien distribuidos globalmente los servicios.

Lo que a muchos que trabajamos en entornos "similares", nos sorprende que un fallo local de almacenamiento en un datacenter, afecte al resto a nivel mundial, pues de ser así, AWS está haciendo alguna cosa mal y se lo tendrá que hacer mirar.

No se replican datos o hubo un problema serio en este aspecto, lo que se es que muchos nos vimos afectados y esta es una de muchas. Por suerte para mi, nada que no pudiera esperar.

Esto tiene su lado positivo, ciertos clientes de AWS repartirán sus próximos proyectos por otras nubes, Azure está ganando más y mas servicios, y esta caída seguro que no la desaprovechan desde Microsoft.

Además de esto, entiendo que AWS deba trabajar duro para evitar una caída como la producida, muchos pensamos que en los próximos años veremos más y más de éstas, pero lo importante es que cada vez dependemos más de estos servicios. ¿Hasta que punto?.

Si quieres opinar del tema, anímate, da tu opinión.


Gracias por acercarte por aquí.

Álvaro Velasco Miguel

3 comentarios:

  1. AWS es un criadero de Virus importante, muchas direcciones IP acaban en las listas negras de cosas como la Russian Business Network o similares por algo, lo recomendable es que si tienes algo importante o crítico, salvo que sepas muy muy bien lo que te haces, prescindas de ese tipo de servicio. Como bien dices, aparentemente otros similares como Hyper-V están bastante mas cuidados...
    Saludos!

    ResponderEliminar
  2. Sobre la caida de AWS... https://www.genbeta.com/web/un-error-tipografico-en-los-amazon-web-services-dejo-por-los-suelos-medio-internet

    ResponderEliminar
  3. Gracias Manuel por tu aportacion,habra un antes y un después en la nube y todo acaba de empezar.
    Un saludo

    ResponderEliminar