Психометрические характеристики китайского клиента: тестирование программы Symanto
Наиболее удобный и быстрый способ исследований аудитории — это исследования онлайн, без специальных опросов, на основе имеющихся данных пользователей в социальных сетях. Для целей маркетинговых и клиентских исследований большое значение имеет возможность автоматизированного анализа текста, в частности, психометрического анализа текста.
Мы проанализировали 56 программ анализа текста, доступных на международном рынке сегодня, и 34 программы анализа социальных сетей. Хотя многие из них заявляют отдельные функции психометрического анализа, чаще всего это ограничено анализом тональности по отношению к бренду. Полноценных программ психометрического анализа клиента / клиентского текста нам удалось выявить только 7:
- LIWC (и программа Receptivity, это более дорогая версия LIWC для бизнеса);
- Symanto AI;
- Humantic AI;
- Crystal;
- Audience;
- SparkToro;
- ChatGTP.
В этом обзоре мы продемонстрируем результаты тестирования программы Symanto Insights Platform. Мы никаким образом не продвигаем эту программу и не имеем с этой компанией деловых отношений. Мы представляем подробный обзор тестирования одной программы по той причине, что таких комплексных программ на международном рынке всего 7.
Эти программы представляют значительное достижение автоматизированного анализа аудитории на сегодняшний день, включая психометрический анализ. Каждая из них обладает обширным функционалом, именно поэтому необходимо представить их по отдельности. Мы надеемся представить обзоры по каждой из этих программ отдельно.
Возможности Symanto
Symanto Insights Platform — это платформа автоматизированного анализа текста, которая предлагает расширенную текстовую аналитику для глубокого понимания потребителей и сотрудников бренда. Инструмент предназначен для анализа комментариев, форумов и отзывов клиентов о бренде или продукте. Symanto упорядочивает данные по темам, подтемам, настроениям и психографике и преобразует их в наглядные графики и диаграммы.
Платформа объединяет данные, основанные на психологии, с данными, генерируемыми искусственным интеллектом. Именно этот тандем позволяет автоматически выделять важные психометрические характеристики клиента, знание которых поможет принимать обоснованные решения для своего бренда.
Разработчики платформы заявляют такие функции как:
- анализ тональности тем;
- возможность выбора словаря в зависимости от отрасли компании;
- перевод (возможность автоматического перевода любого текста на немецкий, английский и испанский);
- тепловая карта (сравнение настроений потребителей и сотрудников по брендам и продуктам с помощью тепловой карты);
- сравнение категорий и тем для выявления относительных достоинств и недостатков конкретного продукта;
- временная шкала (просмотр развития активности, настроений, изменений тем обсуждения и определение тенденций за определенный период времени);
- психографические данные (сегментация потребителей и сотрудников с использованием теории черт личности Карла Густава Юнга);
- капитал бренда (оценка стоимости, которую компания получает от продукта с узнаваемым названием по сравнению с непатентованным аналогом);
- рекомендация бренда (классификация постов и сообщений на группы «Продвигающие», «Отвлекающие» и «Безразличные» и оценка предполагаемого влияние сообщения на других людей);
- сегментация пользователей (отнесение пользователей к одному из 4 различных психографических сегментов — лоялисты, послы, критики и рискованные).
Постановка задачи тестирования
В рамках данной статьи рассмотрим, что из себя представляет SYMANTO INSIGHTS PLATFORM на практике и насколько она полезна в определении психометрических характеристик клиента. Для тестирования возьмем отзыв китайского клиента на программу российского производства КОМПАС-3D — систему трехмерного проектирования, которая активно используется в отраслях промышленности среди профессиональных пользователей для проектирования изделий основного и вспомогательных производств (в машиностроении, в авиастроении, в судостроении и т.д.). Эта САПР популярна и на китайских предприятиях. Один из китайских пользователей — Jianhongwei810 написал о собственном опыте использования программы для 3D-моделирования. Данный отзыв и будем использовать в качестве данных для тестирования.
Текст отзыва на китайском языке:
KOMPAS-3D是俄罗斯的三维设计系统,已成为成千上万企业和数十万专业用户的标准。
KOMPAS-3D广泛应用于机械制造等行业的主副业产品设计中(运输、农业、能源、油气、化工等)仪器制造、飞机制造、造船、机床制造、车辆制造、冶金、工业和民用建筑、消费品等。
最新版本:KOMPAS-3D V20
KOMPAS-3D具备必要的功能,任何复杂产品的设计,ECD或SPDS文件的质量处理,行业任务自动化。易于掌握,免费技术支持,灵活的许可政策,国外CAD的优惠替代,嵌入到企业PLM环境中。
KOMPAS-3D的核心是俄罗斯的C3D几何核心(由ASCON的子公司C3D实验室创建)和自己的软件技术。
现代可配置接口,不仅可以减轻视力负担,减少多余的动作,而且可以确保用户的注意力完全集中在工作文档上。
一个软件的好坏不是自己说好就好的,靠用户口碑相传,真正好的东西没有人会拒绝!就像老毛子的crack,用起来很爽的。
我的第一反应是找出他哪里好然后吸收之
KOMPAS-3D 使用C3D内核,C3D内核由尼古拉·戈洛瓦诺夫领导的阿斯康团队开发。它是用C++开发的,并在Visual Studio中编写。1995年,Ascon的Kompas 3D内核开始工作。如今,阿斯康表示,他们拥有57000名用户,其中大部分在俄罗斯。显然,C3D作为构建Kompas 3D补充产品和附加组件的工具已经有了坚实的基础。C3D业务团队由Oleg Zykov领导。
KOMPAS-3D(K3D),简直就是Solidworks与AutoCAD的完美结合,三维和二维功能很强大,参数化丝毫不逊于Pro/E(CREO),它有个专门的管道模块,搞设计相当方便。
在俄罗斯,学校制图也不用CAD,用的是KOMPAS。
软件界,类似MC和CATIA的综合,操作及其简单,就像数学加减法。阿斯康(Ascon)的产品线很全。二维CAD直接集成在三维里面。
KOMPAS-3D是俄罗斯优化很好的3D设计软件,而且还非常强,自己开发写内核代码,关键是还快速的不断的根据实际使用中遇到的问题或者需求在更新,小步快跑。
举办设计大赛没什么不好,激发大家的热情。但就如UbuntuKylin一样给人的感觉就是,热衷于搞派对营销,不沉下心去搞研发。
我个人觉得,搞设计大赛除了成品的展示,更要让参与者,列出在造型、编程、制图、工艺、CAE分析方面遇到的问题,功能需求(与现行比较),以用户需求为导向应该是不会错的,得民心者得市场。
看看,ru-RU_ASCON的KOMPAS-3D的作品展示吧,这些基本都是使用单位提交的可用于实际生产制造的数模。
KOMPAS-3D V20_建模界面与版本,很眼馋别国有这么好的设计软件。
ШАГ 1. Подготовка и загрузка данных
Регистрируем
учетную запись на сайте Symanto, подтверждаем e-mail и входим в личный кабинет. На начальной странице
видим заранее представленные для тестирования массивы данных, количество единиц
текста, доступных для хранения и анализа, и ячейку под будущие аналитические
проекты. Чтобы создать новый проект, нужно добавить в хранилище необходимые
данные, для чего далее переходим в Data Hub. Data Hub — это хранилище
данных для анализа. Сюда мы всегда можем зайти, чтобы увидеть превью текстовых
данных, сюда же загружаются новые данные. Для загрузки нажимаем Add Data. На вкладке загрузки данных видим два способа: загрузить собственную базу данных или собрать онлайн-отзывы напрямую с какой-либо платформы. Поскольку текст у нас сохранен заранее, выбираем опцию загрузки файла. Далее
видим требования к файлу: он должен быть представлен в .xlsx или.csv форматах,
в первой строке должны быть имена столбцов, а в одной ячейке не должно быть
более 2000 символов, в противном случае текст будет обрезан. Идем
в Excel и загружаем туда отзыв на китайском, предварительно
подготовив столбцы: указываем имя клиента, дату написания отзыва, название
программного продукта, сам текста и язык текста. Такое структурирование — залог
адекватного анализа текста, потому что на практике мы загружаем не один отзыв,
а сразу несколько от разных пользователей, о разных продуктах, написанных в
разное время. Увидим далее, что это окажется полезным. Выбираем
название столбца, содержащего текст для анализа. Далее выбираем столбец, содержащий дату написания отзыва, указываем формат даты. Указываем
столбец, в котором содержится информация о языке текста. Обратим внимание, что
наименование языка должно быть представлено в виде двухзначного буквенного кода
согласно стандарту ISO 639-1. Наконец,
указываем, что в файле нет столбца с информацией о рейтинге продукта. Если бы
отзыв был взят с сайта отзывов, информация об оценке того или другого продукта
была бы нам полезна, но в нашем случае китайский пользователь не предоставил
свою оценку. Наконец,
после указания всей информации видим превью нашей базы данных — при прокрутке
вправо также видна вся информация, которую мы записали в Excel. В Data Hub нажимаем на Analyse. Выбираем данные для анализа из нашего хранилища. Выбираем
название проекта и язык текста. Вспоминаем, что наш текст представлен на
китайском языке, а значит, его нужно перевести на один из поддерживаемых языков
для дальнейшего анализа. Программа сделает это автоматически — выбираем
английский язык и устанавливаем флажок на опции Translate all my data into the
selected language. Подтверждаем
настройки и создаем проект для анализа. Спустя
минуту загрузка и обработка данных завершена, и мы можем приступать к нашему
проекту. Но не все так быстро — для начала нужно выбрать модули, по которым
программа будет проводить дальнейший анализ. Это как раз те модули, о которых
было заявлено в функциях платформы: В
исходном виде они все выключены, добавляем для анализа все перечисленные
модули. При
добавлении первого модуля нам предлагают выбрать отрасль, к которой относится
анализируемый бренд или продукт. Именно от этого выбора будет зависеть
дальнейший процесс выявления тем и подтем в тексте. На выбор предлагаются
несколько отраслей: банковская, автодилерская, потребительской электроники,
электронной коммерции, гостиничная, фармацевтическая, ресторанная, отрасль
розничной торговли, доменная индустрия. Можно также выбрать модуль, связанный с
удовлетворенностью сотрудников компании. Словарь на базе отрасли
потребительской электроники включает в себя такие категории как характеристики
продукта, особенности, процесс доставки, опыт розничной торговли и в большей
мере подходит для нашего кейса. Здесь
же можно вновь увидеть превью анализируемых данных — уже в обработанном виде на
английском языке. Такой просмотр поможет перепроверить, тот ли массив данных
отправлен на проверку, и будет полезным для определения отрасли, к которой
относится конкретно этот массив данных. Весь
текст отзыва на английском языке выглядит следующим образом: KOMPAS-3D is a Russian 3D design system that has become the standard for thousands of companies and hundreds of thousands of professional users. KOMPAS-3D is widely used in the design of main and sideline products in machinery manufacturing and other industries (transportation, agriculture, energy, oil and gas, chemical industry, etc.), instrument manufacturing, aircraft manufacturing, shipbuilding, machine tool manufacturing, vehicle manufacturing, metallurgy, industrial and civil construction, consumer goods wait. Latest version: KOMPAS-3D V20 KOMPAS-3D has the necessary functions for the design of products of any complexity, quality processing of ECD or SPDS files, automation of industrial tasks. Easy to master, free technical support, flexible licensing policy, preferential replacement of foreign CAD, embedded in the enterprise PLM environment. At the heart of KOMPAS-3D is the Russian C3D Geometry Core (created by ASCON’s subsidiary C3D Laboratories) and its own software technology. A modern configurable interface that not only eases the strain on eyesight and reduces redundant movements, but also ensures that the user’s attention is fully focused on the working document. Whether a software is good or bad is not just what you say, it depends on the word of mouth of users, and no one will reject something that is really good! Just like Lao Maozi’s crack, it’s very cool to use. My first instinct was to find out what’s good about it and absorb it. KOMPAS-3D uses the C3D kernel, which was developed by the Ascon team led by Nikolai Golovanov. It is developed in C++ and written in Visual Studio. In 1995, Ascon’s Kompas 3D kernel started working. Today, Ascon says they have 57,000 subscribers, most of them in Russia. Clearly, C3D already has a solid foundation as a tool for building complementary products and add-ons to Kompas 3D. The C3D business team is led by Oleg Zykov. KOMPAS-3D (K3D) is simply the perfect combination of Solidworks and AutoCAD. It has powerful 3D and 2D functions, and its parameterization is no less than that of Pro/E (CREO). It has a special pipeline module, which is quite convenient for design. In Russia, CAD is not used for school drawing, but KOMPAS is used. In the software world, it is similar to the synthesis of MC and CATIA, and the operation is extremely simple, just like mathematical addition and subtraction. Ascon’s product line is very comprehensive. 2D CAD is directly integrated into 3D. KOMPAS-3D is a well-optimized 3D design software in Russia, and it is also very powerful. The key is to develop and write the kernel code by yourself, and the key is to quickly and continuously update according to the problems or needs encountered in actual use, and run in small steps. There’s nothing wrong with having a design competition, it sparks enthusiasm. But just like UbuntuKylin, it gives people the feeling that they are keen on party marketing and don’t sink their hearts into research and development. I personally think that in addition to the display of finished products, the design competition should allow participants to list the problems encountered in modeling, programming, drawing, technology, CAE analysis, functional requirements (compared with the current one), and be user-oriented There should be no mistake, those who win the hearts of the people win the market. Take a look, ru RU_ASCON’s KOMPAS-3D works display, these are basically digital models submitted by the user unit that can be used for actual production. KOMPAS-3D V20_Modeling interface and version, I am very envious of such a good design software in other countries. Достаточно точный перевод без внушительных смысловых и морфологических ошибок. Приступим к анализу данных. Указано,
что для анализа был использован массив из одной единицы данных, одного текста.
Здесь можно представить данные группировано и структурировать их по
наименованию продукта, автору поста и другим характеристикам, которые мы
заранее указываем при загрузке таблицы в программу. При загрузке большего
массива данных с отзывами от разных людей и (или) о разных продуктах/брендах
создается точечная диаграмма, позволяющая сравнить количество отзывов по
каждому из пунктов. «Классификация»
дает обзор всех обнаруженных категорий, основных тем, количества единиц текста,
содержащих данные категории и темы, а также соответствующее настроение в
процентном выражении. Кроме того, можем увидеть количество текстов с темами
положительного настроения, нейтрального и отрицательного. Настроение (Net Sentiment) рассчитывается по
следующей формуле: Чистое настроение = [(количество положительных терминов — количество отрицательных терминов)/общее количество терминов] *100 Так, видим 6
категорий, относящихся к выбранной отрасли, при этом всего в тексте было
выявлено 23 темы. Общее чистое настроение текста — положительное на 43%. Категория
с наибольшей величиной показателя чистого настроения — Service,
с наименьшей величиной — Software (положительные и
отрицательные темы поровну) и Product Components (нейтральные темы). Выявленные темы в разбивке по категориям и с указанием
чистого настроения представлены на рисунке ниже. Можно
настроить категоризацию и вручную добавить в категории и темы термины, которые
не были автоматически распределены. Изменили категоризацию, из неопознанных терминов добавили в Software 3 термина: Добавили в Usage occasion термины: Остальные термины вручную трудно распределить однозначно. Получили следующую картину, количество выявленных тем увеличилось, а также изменилась оценка их настроения. Например, в категории Software увеличилась доля нейтрального настроения, а в теме Usage occasion чистое настроение снизилось с 100% до 50%. Проанализируем одну из тем более подробно. Например, автор поста, говоря о теме Usability из категории Performance, был исключительно позитивен, а психографическая диаграмма показывает, что, обсуждая эту тему, он был рационален и ориентирован на факты. Также он выступал амбассадором удобства использования программы. И так можно посмотреть психографику и психографические сегменты для каждой темы. Представление в виде пузырьковой диаграммы особенно полезно для легкого определения высокозначимых/критических тем: Показан объем конкретной темы по оси y и чистое настроение в % по оси x. Например, чем дальше тема находится справа и чем дальше она вверху, тем больше людей говорят о ней положительно. В виде пузырьковой диаграммы категории распределились следующим образом. Так, автор текста чаще упоминал категорию Software, а категория с наиболее позитивной окраской — Performance. Распределение настроений позволяет понять настроения на основе положительных, отрицательных и нейтральных тем и выбранных вами мета-значений. Показанный здесь объем = количество упоминаний темы. В то время как в «Sentiment Analysis — Overview» настроения отображаются на уровне терминов, здесь в «Sentiment Distribution» настроения отображаются на основе положительных и отрицательных семантических отношений, то есть программа анализирует окраску не отдельных терминов, а высказываний и предложений в целом. Так, в таблице дублируется уже известное нам значение чистого настроения тем. При этом высказывания автора о программе были на 46% позитивны, на 50% нейтральны и на 4% негативны. Облако терминов в модуле Topic & Sentiment Detection позволяет глубже изучить фразы категорий и тем (а также соответствующие сообщения), которые наиболее часто появляются в ваших данных. Чаще всего в тексте упоминаются термины Interface и Software, причем первый — с положительной окраской, а второй — с негативной. Можно настроить облако слов, изменив количество слов, входящих в облако (25/50/75/100), а также сделав разбивку по положительным и отрицательным терминам. Кроме того, при добавлении большего массива данных с несколькими отзывами в данном модуле возможно составление тепловой карты настроений и драйверов чистых настроений, а при добавлении даты строится распределение тем и чистого настроения во времени. Именно поэтому в первом шаге при составлении исходной таблицы данных мы указывали дату написания отзыва, наименование продукта и имя автора. Анализ настроений в модуле Sentiment Analysis основан на модели глубокого обучения на пост-уровне, которая определяет настроения всего текста и конкретных тем или категорий. Он не ограничивается анализом настроения по ключевым словам, а рассматривает предложения и абзацы в целом, чтобы понять, какие настроения связаны с той или иной темой. Анализ настроения дополняет анализ категорий и тем, чтобы передать не только то, о чем говорит человек, но и его отношение к этому. На графике вы увидите объем текста, чистое настроение, а также гистограмму с абсолютными и относительными показателями настроения. Автор текста на 100% позитивен в своем отношении к программе KOMPAS-3D, об этом говорит само построение им предложений и абзацев, а не только то, что он использовал больше «позитивных» тем и категорий в своем тексте. В этом модуле также возможно отследить изменение показателя чистого настроения с течением времени, воспользовавшись инструментом Net Sentiment Over Time. Модуль Personality Traits позволяет разбить данные по всем доступным мета-значениям в проекте и отображает агрегированное представление черт личности: «эмоциональная» и «рациональная». Черты личности — это фундаментальные блоки менталитета человека, а также то, как он выражает свои мнения/убеждения и принимает решения. В основе черт личности лежат две полярные характеристики: Обратив внимание на график, представленный ниже, мы можем сказать, что Jianhongwei810 является на 100% рациональным потребителем и оценивает продукт, детально анализируя его качества, характеристики и принимая взвешенное решение. Данный инструмент показывает, как характеристики личности «эмоциональной» и «рациональной» могут быть разбиты по категориям и темам. Так, автор текста полностью рационален по отношению ко всем категориям, упоминаемым в посте. И, разумеется, полностью рационален по отношению ко всем темам, входящим в упомянутые категории. Его восторг программой аргументирован, решение принято не на эмоциях. Можем сказать, что он довольно объективен при принятии решений относительно тех или иных продуктов. Существует 4 различных психографических сегмента (типы клиента по отношению к продукту): Лоялисты, Амбассадоры, Критики и Рискованные. Кроме того, существует нейтральный сегмент. Каждый из них определяется индивидуальностью и тональностью настроений человека, текст которого мы анализируем. Представим эти 4 сегмента в таблице: На графике видно, что по отношению к программе автор текста является на 100% амбассадором. Данная характеристика сложилась из результатов анализа предыдущих модулей: мы уже видели, что автор высказывает свое мнение по большей части в положительном тоне и полностью рационален в своих рассуждениях. Такого клиента очень выгодно иметь бренду — благодаря своим аргументам и рассуждениям он сможет привлечь больше заинтересованных людей, которые в перспективе могут стать коммерческими клиентами.ШАГ 2. Создание и подготовка проекта для анализа
ШАГ 3. Анализ данных и интерпретация результатов
Overview — общий обзор
1 модуль. Topic & Sentiment Detection
1.1 Classification
1.2. Sentiment Distribution
1.3. Term Cloud
2 модуль. Sentiment Analysis
3 модуль. Personality Traits
3.1. Характеристики личности по темам (Traits by Topic)
4 модуль. Psychographic Segments
Сегмент Описание Тональность Влияние на продукт/бренд Лоялист Эмоционально привязан к бренду/продукту/услугам и является одним из самых лояльных покупателей бренда Позитивный + эмоциональный Промоутер Амбассадор Хорошо продвигает продукт, поскольку его мнения выражаются в позитивной и рациональной манере, что может сильно повлиять на других потребителей, сравнивающих продукт/услугу с конкурентами Позитивный + рациональный Промоутер Критик Чаще всего неудовлетворен в связи с рациональными и логичными причинами. Углубляясь в его жалобы и болевые точки, проще всего изменить его мнение на позитивное Негативный + рациональный Недоброжелатель Рискованный Наиболее разочарованные потребители, которые эмоционально не связаны с брендом/продуктом/услугами. Они чаще всего делятся своим разочарованием, чем мнением, что может сильно повлиять на других эмоциональных потребителей. Негативный + эмоциональный Недоброжелатель