НАБ используется в Европе “высокой воды эталон” о защите персональных данных, как ограждения для своих растущих аппетитов аналитика, усложняя ее по-прежнему развивается архитектура данных.

Главный офицер сведения Гленда Крисп рассказал на недавнем саммите AWS в Сиднее, что НАБ-проектирование архитектуры данных для удовлетворения прогнозируемого более высокого уровня конфиденциальности на внутреннем рынке.

Банк уже тема для общих правил по защите данных (GDPR) правил, так как он обрабатывает данные, касающиеся европейской экономической зоны (ЕЭЗ) жителей.

Крисп отметил, что инициирование GDPR-как права потребителей, такие как право быть забытым и права требовать от человека быть вставлен в противном случае автоматизированного процесса – были сложные проблемы с архитектурной точки зрения решения.

Однако, она указала, желание решить для них сейчас – с целью их потенциально быть принят как часть будущих внутренних правил конфиденциальности.

“О конфиденциальности, я думаю, что важно принять глобальный взгляд на это и думаю о том, что происходит, какие тенденции, что происходит?” Крисп сказал.

“Высокой воды-тест в Европе с GDPR. Под GDPR, человек имеет право быть забытым. Поэтому мы должны построить нашу платформу так, что пока мы позволяем, что право быть забытым, мы на самом деле не уничтожает и развращает наших моделей нисходящих данных. Это не простая вещь, чтобы решить для.

“Мы также знаем, что регуляторы обеспокоены AI и машинного обучения. Опять же, возвращаясь к Европе и GDPR, человек имеет право просить человека быть частью решения.

“Это означает, что я [в банке] не могу создать закрытую сквозной процесс, который полностью автоматизирован, поэтому я не могу перейти от модели машинного обучения для решения двигателю результата. Мне нужно построить путь для клиентов, чтобы запросить вмешательства человека и что человека быть частью процесса в плавный способ.

“Поэтому нам нужно подумать об этом, как мы строим наши модели развертывания модели”.

Хрустящий использовал ее выступление на саммите АРМ выложить поддержки для проектирования архитектуры данных и аналитические модели, чтобы соответствовать высоким стандартам конфиденциальности и безопасности, при выкорчевывании потенциальных источников и причин смещения.

Она отметила усилия с участием Австралийская комиссия по правам человека настаивает на создании ИИ политики Совета в качестве доказательства более широкого сообщества проблем“, которые существуют во многих отраслях промышленности, как данные и ИИ используется”.

“Все должны иметь эту проблему – мы все должны сделать шаг в этом”, – сказала она.

“Мы должны продолжать настаивать на explainability и прозрачности в наших моделях. Мы должны убедиться, что у нас есть право управления, чтобы контролировать, как создаются эти модели и как они продолжают работать”.

Крисп сказал, что НАБ было хорошо зарекомендовавшие себя модели кредитного риска, рыночного риска и риска ликвидности, но это заверение и управления должны быть усилены, если и когда часть этих моделей были улучшены AI или машинного обучения.

Банк заявил в прошлом году , что его функция риск был целью использования для машинного обучения. Другие ‘Большой 4’ банки как ANZ также экспериментировал с включением ИИ в определенных рисковых функций.

“Мы, конечно, очень тесно сотрудничаем с нашей модели управления рисками и их процесс проверки модели,” сказал хрустящий.

“У нас были эти процессы довольно долгое время вокруг себя кредитный риск, рыночный риск, риск ликвидности, и поэтому мы поднятие включить моделей машинного обучения.”

Архитектура данных развивается

НАБ также использовать саммит, чтобы показать последний год работы в построение архитектуры данных НМЗ.

В апреле прошлого года, НАБ объявил его “первый набег данных в облаке” в виде упругого озера данных, построенных на сервисы AWS.

В настоящее время она имеет ряд ключевых компонентов, которые составляют ее архитектура данных.

Озеро данных, которое вызывается НАБ концентратор данных или НДХ – таки есть, хотя это не только АРМ делом.

“Информатика-это слой управления данными [в НГХ] – это наша книга-запись метаданных, LineAge и качества данных”, – сказал Крисп.

“Мы используем Кафка на поток, мы используем Апач балки для перемещения данных между зонами – между сырье, куратор и преобразимся и мы, конечно, использовать S3 ведер [сохранить данные].”

Четкие подчеркнул, НАБ мысли по организации его данных и обеспечения преемственности данных – откуда он взялся и чем все это закончилось в государстве-это в – прозрачный.

“Я говорю моей команде практически ежедневно, разница между [данные] озеро [данные] болото-это метаданные. Если вы не помечали свои данные с техническими и бизнес-метаданные, вы создали болото и вы на самом деле не знаю, какие данные у вас есть, и вы, конечно, можете не получить возможности повторного использования из него,” сказала она.

“Родословная-это тоже важно. Он говорит нам, не только там, где мы получили данные, но то, что мы сделали это: какие расчеты мы проанализировать, какие преобразования произошли, мы агрегируем данные, мы отфильтровать данные?

“Все это очень важно для аналитики команде, так что они знают, они получили нужные данные для правильной цели.

“Поэтому на выставке NAB, как мы строим нашу платформу, мы на самом деле приземление сведения сырьевой зоны и указать ему коммерческие и технические метаданные, а затем по мере продвижения от сырья к куратором и [С], чтобы соответствовала, мы публикуем эти линии компоненты так, что у нас есть автоматизированная след в родословной данные, как она движется через облако.”

Из НГХ, некоторые из применений данных, как ранее сообщало открытие НАБ облако, а также новый элемент под названием служб отчетов НАБ.

Облако Discovery-это “продвинутая платформа НАБ аналитика” и в рабочей области, используемой по обработке данных.

В то время как данные ученые в настоящее время “огромное пользователями Jupyter тетради” – это де-факто стандарт открытым исходным кодом инструмент в данные науки, четкий отметить других инструментов в миксе.

В частности, с точки зрения АРМ, который включает в себя SageMaker, программы управляемых услуг, призванный помочь компаниям получить алгоритмы машинного обучения обучаются и в производство быстрее.

“Мы пилотируем и POCing SageMaker и поставив его через наш процесс проверки безопасности,” сказал хрустящий.

Служб отчетов представляется относительно новым элементом архитектуры данных.

Крисп не вдавался сильно, другие, чем сказать, что это дом в “двух наших новейших инструментов, Thoughtspot и мощность Би – тоже на облаке”.

ThoughtSpot делает ИИ-движок на основе анализа, что позволит сократить время, затраченное на поиск информации в данные. Мощность Би-динамично развивающаяся служба Microsoft, найдя дома все больше и больше предприятий.

Яркий осветил эволюцию среды данных, и в частности, тот факт, что это не в чистом виде стека AWS.

“То, что я хотел бы, чтобы вы вынесли из этого архитектура-да, мы используем AWS и мы [также] используют открытый исходный код и мы используем программное обеспечение”, – сказала она.

“Мы делаем это потому, что мы думаем, что это дает нам наилучшее сочетание и сочетание возможностей, которые дают нашим сотрудникам инструменты, необходимые для обслуживания наших клиентов.”

Крисп отметил, что архитектурные схемы было упрощенным (“это выглядело путь, путь, путь слишком заняты”) и подлежит изменению.

“Это на сегодняшний день, и моя команда очень хорошо опробовать новые технологии и методы, и так это будет выглядеть по-разному в течение примерно шести месяцев”, – сказала она.

ОСТАВЬТЕ ОТВЕТ

Please enter your comment!
Please enter your name here