Apogeo de los datos sintéticos y dudas sobre cómo protegerlos

22/03/2022

353

A mediados de febrero, un estudio de la empresa Validity (que se dedica a optimizar la gestión de las relaciones con los clientes) revelaba que la mala calidad de los datos en este ámbito ya estaba provocando un impacto negativo en la cuenta de resultados de las compañías.

Si los datos son el petróleo de la economía digital, su escasez se está convirtiendo en un problema. Un problema originado por la cada vez mayor concienciación en privacidad y los esfuerzos regulatorios que potencias como la Unión Europea impulsan en esta materia.

Luis Ignacio Vicente del Olmo es CINO (jefe de Innovación) en Asti, una firma española dedicada al desarrollo de robots de transporte, y consejero estratégico en la consultora Pons IP. Explica a Business Insider España que “la falta de datos” ya fue un problema en los 90, cuando responsables del censo en EEUU se dieron cuenta de que en barrios de Chicago no tenían los suficientes datos de los vecinos.

Su propio nombre lo indica. Los datos sintéticos son datos generados de forma artificial y que pueden ser utilizados para entrenar modelos de inteligencia artificial, en el caso de que los datos reales carezcan de calidad o no sean demasiados. En sectores como el industrial, Vicente del Olmo tiene claro que la importancia se le dará a los datos no personales y a estos datos sintéticos.

Por ejemplo: un algoritmo que se encargue de detectar posibles errores, vetas o debilidades en materiales. En un contexto industrial, es improbable que un algoritmo tenga una eficacia del 100% detectando esas imperfecciones en materiales como el acero o el hormigón. Pero si ese algoritmo se entrena con datos sintéticos sobre elementos de esos materiales que en realidad no existen, su capacidad aumenta.

Un niño de cuatro años puede diferenciar una vaca de un perro sin dificultades. Un algoritmo de aprendizaje automático tendrá que consumir primero miles de imágenes de una vaca para entender qué está viendo. Si en lugar de buscar miles de vacas para hacerles miles de fotos el algoritmo pudiese entrenarse con vacas de mentira, vacas sintéticas, todo el proceso sería mucho más sencillo.

De ahí la importancia que estos datos sintéticos irán cobrando en los próximos años, en contextos como el sector industrial o incluso el sanitario.

De hecho, ya en el Hype Cycle sobre la inteligencia artificial que elaboró Gartner el año pasado aparecían estos datos sintéticos al alza. Es algo que en un futuro inmediato va a ganar importancia en el mundo de la innovación y la automatización. Por eso, a juicio de Luis Ignacio Vicente del Olmo, es crucial encontrar la fórmula para proteger estos nuevos activos, estos datos sintéticos.

Múltiples voces vienen demandando la necesidad de superar el marco contable del siglo XIX. Una cuenta de resultados, destacan autoridades como la secretaria de Estado de Digitalización, Carme Artigas, no refleja adecuadamente “la capacidad innovadora” de una compañía. La fundación Corporate Excellence reúne a grandes firmas del Ibex 35 para mejorar la gestión de esos activos intangibles.

En una entrevista, también con este medio, los responsables de dicha fundación fueron bastante claros: “Muchas empresas eran gobernadas solo con indicadores financieros, lo que explica muchas crisis”.

Entre los activos intangibles se pueden destacar reputación, huella de carbono y datos. Y con la llegada de los datos sintéticos, Vicente del Olmo, de Pons IP, recuerda que la propiedad intelectual y la propiedad industrial es el principal mecanismo para hacer tangibles esos activos que hasta ahora eran intangibles.

La gran duda es, ¿cómo? “Una primera posibilidad sería proteger los datos sintéticos como un secreto empresarial. Pero eso no basta: hay que tener un protocolo de secretos en la organización, con medidas informáticas y de procesos”.

La alternativa: explorar el derecho sui generis de bases de datos, que nació al abrigo de una regulación de la Comisión Europea “para intentar demostrar que este tipo de activos tienen un valor”. Este derecho aparece en el articulado de la Ley de la Propiedad Intelectual en España, y permite proteger bases de datos. El problema: para que una base de datos pueda protegerse con esa norma, es importante que el solicitante demuestre que “la obtención, la verificación o la presentación de dicho contenido representen una inversión sustancial”.

Con datos personales eso es indemostrable. No se puede comprobar que una empresa ha hecho una inversión sustancial para catalogar y reunir en una base de datos los datos de personales de miles de personas. Fundamentalmente porque el propietario de esos datos personales no será nunca la propietaria de la base de datos.

BUSINESS INSIDER (20/03/2022)

Más información aquí