“Me han añadido a un grupo de WhatsApp por error, y tengo acceso a un montón de datos personales!”
Me inscriben en un grupo donde no conozco a nadie ni nadie me conoce. Han introducido mi teléfono por error, se deben haber equivocado en una cifra. El caso es que tengo acceso a sus conversaciones, nombres, números de teléfono… Y hay alguien que se supone que debería estar en este grupo que sin embargo no estará.
“Google Flu Trend se basó en datos erróneos para realizar predicciones de gripe, así que las autoridades médicas se prepararon para atender el doble de personas de las que enfermaron”
Lanzado en 2008 con la esperanza de utilizar información sobre las búsquedas online de personas para detectar brotes de enfermedades, Google Flu Trend monitorizaba las búsquedas de los usuarios e identificaba los lugares donde muchas personas estaban investigando síntomas de la gripe. En esos lugares, el programa alertaba a las autoridades de salud pública de cuantas personas estaban a punto de contraer la gripe.
Pero el proyecto no tuvo en cuenta la posibilidad de los cambios periódicos en el propio algoritmo de búsqueda de Google. En una actualización de principios de 2012, Google modificó su herramienta de búsqueda para sugerir un diagnóstico cuando los usuarios buscaban términos como «tos» o «fiebre». Por sí solo, este cambio aumentó el número de búsquedas de términos relacionados con la gripe. Así que Google Flu Trends interpretó que los datos predecían un brote de gripe dos veces más grande de lo que esperaban los funcionarios federales de salud pública, y mucho más grande de lo que realmente sucedió. Este es un buen caso de datos erróneos porque involucra información sesgada por factores distintos a los que se estaban midiendo.
“Hasta 7000 estudiantes extranjeros fueron expulsados del Reino Unido debido a errores en los datos de reconocimiento de voz”
En mayo de 2018, el Ministerio del Interior del Reino Unido enfrentó una crisis cuando surgieron acusaciones de que se obligó a 7,000 estudiantes extranjeros a que abandonaran el Reino Unido por error. Después de ver un informe del programa Panorama de Channel 4 sobre el fraude de inmigración a través de exámenes de lenguaje falsificados, Theresa May solicitó un examen más detenido de los resultados de las pruebas de Educational Testing Services, una compañía con sede en Princeton, Nueva Jersey. ETC creó y administra la Prueba de Inglés para la Comunicación Internacional (TOEIC), así como una serie de otras pruebas estandarizadas importantes, incluyendo el GRE y el TOEFL.
El análisis entregado al gobierno del Reino Unido dijo que había cerca de 34,000 resultados de prueba TOEIC «no válidos». Más de 22,000 resultados adicionales se consideraron «cuestionables». Actuando en esos casos, el gobierno negó, recortó o canceló los visados de casi 36,000 personas. De ellas, 1,400 personas fueron detenidas por algún tiempo, y otras 4,600 fueron expulsadas del país.
Sin embargo, el sistema automatizado que ETS usó para identificar resultados de pruebas falsas fue defectuoso, lo que significa que algunas de esas deportaciones podrían no estar justificadas. ETS había tratado de identificar el fraude utilizando un software de reconocimiento de voz, de acuerdo con la decisión del tribunal de apelaciones. Analizaron todas las pruebas del Reino Unido e intentaron identificar los casos en los que la misma persona hablaba en la parte verbal de las pruebas múltiples. Una sola voz que tome varias pruebas con diferentes nombres probablemente hubiera sido una persona que realizó la prueba de manera fraudulenta.
Sin embargo, la tecnología de reconocimiento de voz no es perfectamente confiable. Si bien los mejores sistemas de identificación de voz tienen tasas de error muy bajas, solo identifican incorrectamente a alguien entre el 0,5% y el 1% de las veces. La compañía estaba al tanto de las limitaciones de la identificación automática de voz y, en su proceso, cada muestra vocal marcada como «sospechosa» por el algoritmo fue luego verificada por dos humanos en la compañía. Pero los analistas humanos solo estuvieron de acuerdo con la computadora alrededor del 60% de las veces.
Los expertos que luego llamaron para ese caso dijeron que estos empleados de ETS probablemente no estaban adecuadamente capacitados, y estimaron la tasa general de falsos positivos en torno al 1%. Sin embargo, incluso al 1%, varios cientos de resultados de prueba marcados como «no válidos» por la tecnología podrían haber sido, de hecho, analistas honestos. También podrían haber ocurrido otros errores. Algunos de los que apelaron dijeron que la grabación de voz que recibieron de su sesión de prueba no era el archivo correcto. Un abogado de inmigración colocó la tasa de error entre 5% y 10%, según The Guardian. Eso supondría la cantidad de deportaciones injustas en miles.
“Debido a inexactitudes en las estadísticas sobre vidas de personas indígenas, no se actuó para prevenir muertes evitables”
Las inexactitudes en la recopilación y el acceso a las estadísticas vitales de los pueblos indígenas impiden la implementación estratégica de iniciativas de salud pública basadas en evidencias para reducir las muertes evitables. Hay disponibles cinco fuentes de datos de salud pública primarias o básicas: censo, registro vital, vigilancia, datos administrativos o de utilización de la atención de salud y datos de encuestas de salud, y se ven afectadas por los retos subyacentes. En general, el desafío es sobre la identificación correcta, inclusiva y coherente de los pueblos indígenas en los 5 grupos. Sin embargo, la determinación precisa de los nacimientos y defunciones de la población (estadísticas vitales) es fundamental para la evaluación precisa de las tendencias de mortalidad (…) Aunque los datos básicos de salud pública demuestran el estado de salud cambiante de la población y posibilitan los efectos de las políticas de salud, de los servicios e intervenciones que se deben monitorear y evaluar, los datos de estadísticas vitales proporcionan el numerador y el denominador necesarios para calcular las tasas de mortalidad. Las deficiencias e imprecisiones en las estadísticas vitales y otras recopilaciones de datos impiden la implementación estratégica de intervenciones de salud pública basadas en evidencia para prevenir la mortalidad evitable (por ejemplo, falta de datos de vacunación y accidentes y lesiones evitables). Por lo tanto, se requieren nuevas estrategias para mejorar la determinación, la recopilación y el informe de los datos dentro de las poblaciones indígenas, prestando más atención a la política ética y al rigor metodológico.
“Tenía un contrato doméstico con una operadora pero siempre me llamaban para hacerme ofertas comerciales dirigidas a empresas o autónomos”
Pablo nos cuenta el caso de su conexión adsl/fibra casera, en la que sin embargo figuraba como si fuera de una empresa. Le llamaban y le mandaban mensajes ofreciendo productos que no quería, y aunque los hubiera querido, tampoco los podía aceptar porque no cumplía los requisitos legales para ello.
“Una transferencia bancaria errónea hace que su banco la considere millonaria”
Alba nos cuenta su caso cuando trabajaba en una multinacional y a toda la plantilla les ingresaron las nóminas en euros como si fueran pesetas. A raíz de este error, su banco la consideró una persona rica y le mandaba publicidad de cosas que ella no necesitaba (fondos de inversión, etc.)
“En 2002 un informe publicó que el 23.6% de todo el correo postal de EE.UU. no estaba correctamente direccionado”
En 2002, USPS y PricewaterhouseCoopers publicaron un informe que indicaba que el 23.6 por ciento de todo el correo enviado de los EE. UU. se envió de manera incorrecta.
¿Cómo es posible que casi un cuarto de todo el correo en los Estados Unidos se envíe de forma incorrecta? Es sencillo. Los trabajadores de los ‘call centers’ pueden cometer errores tipográficos o malinterpretar acentos extranjeros o nombres de calles. Los propios clientes pueden introducir información de direcciones incompletas a través de la Web, omitiendo detalles críticos como números de pisos o direcciones (NW, Este). Algunos clientes pueden no estar seguros de sus códigos postales exactos.
“Google utiliza las mediciones de calidad del aire de una startup en lugar de las oficiales, y estos datos no son fiables”
Las búsquedas en Google de “calidad del aire» en el área de la Bahía de San Francisco actualmente están vinculadas a datos erróneos proporcionados por una empresa externa. Es necesairo verificar con los datos actuales de EPA AirNow en caso de sufrir de asma o problemas respiratorios.