Sdscompany.ru

Компьютерный журнал
16 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Индекс читаемости флеша

Анализ и оценка удобочитаемости и естественности текста

Описание

Сервис позволяет определить такие качественные показатели текста как удобочитаемость и естественность.

Удобочитаемость текста

Данный параметр раскрывается через два индекса: фог-индекс и индекс Флеша.

Фог-индекс (Индекс туманности Ганнинга)

Фог-индекс обычно используется для подтверждения легкости чтения предполагаемой аудиторией. Тексты для широкой аудитории, как правило, требуют индекса туманности менее 12, тексты для детей нуждаются в индексе менее 8. Научные публикации имеют индекс 20 и выше, такие тексты очень трудно понять без специальной подготовки.

В нашем сервисе данный коэффициент рассчитывается с некоторыми особенностями:

Для расчета используются все слова, а не выборка из 100 слов.

Учитываются сложносочинённые предложения, они считаются за два предложения.

Используется поправочный коэффициент 0,78 для русских текстов.

При подсчете сложных слов не учитываются составные слова и имена собственные, а глаголы ставятся в начальную форму. Сложные слова — это слова из трёх или более слогов.

Индекс Флеша

Еще один индекс для определения сложности восприятия текста. Изначальная формула применяется для английского языка, в нашем сервисе используется адаптированная версия для русского языка.

Индексы удобочитаемости имеют ограничения, так как на трудность восприятия сильнее всего оказывают влияние семантика и абстрактность текста.

Естественность текста

Следующая группа показателей позволяет сделать оценку текста с точки зрения злоупотреблений ключевыми словами и фразами, которые могут повлиять на признание текстов поисковым спамом.

Общая естественность текста по Ципфу

Данный показатель рассчитывается по закону Ципфа. Частотность слов в тексте распределяется по статистическому закону — то есть обратно пропорционально рангу в тексте (ранг — это порядковый номер слова в списке, который составлен по убыванию частотности слов в тексте).

Общая естественность расшифровывается подробной таблицей, где показывается ранг слов в тексте, их частотность и отклонения от нормы. Даны рекомендации о необходимых изменениях в тексте для увеличения его естественности. Если данный показатель больше 50, то текст вполне естественный. Желательно поднимать данный показатель до 80 или выше.

Академическая тошнота

Данный показатель рассчитывается по всем часто повторяющимся словам, показывает общую загруженность текста повторами слов. При написании текстов, не рекомендуется превышать данный показатель выше 40%.

Классическая тошнота

В отличие от предыдущего показателя, данный рассчитывается по одному, самому часто повторяемому слову. Желательно писать тексты с показателем ниже 7, а лучше ниже 3.

Также в сервисе «Анализ и оценка удобочитаемости и естественности текста» приводятся общие статистические показатели текста, которые используются при расчетах.

Проверка текста на читабельность для SEO

Вставьте URL для анализа • Проверьте текст на читабельность • Перепишите некачественный контент

Введите URL, текст которого вы хотите проверить на читабельность.

По результатам проверки вы получите оценку уровня читабельности по Ганнингу и Флэшу.

Перепишите участки текста с плохим индексом удобочитаемости сразу в онлайн редакторе.

Опубликуйте обновленный СЕО текст и отследите, как изменится поведение пользователей на странице.

Возможности

Проверка на читабельность

Индекс туманности Ганнинга рассчитывается исходя из длины предложения и сложности слова. Индекс удобочитаемости Флэша указывает то, насколько трудным является чтение.

Навигация по тексту

Плохие участки текста с точки зрения читабельности можно подсветить в окне редактирования с помощью удобной навигации.

Исправляйте текст сразу же в онлайн редакторе. Инструмент перепроверяет оценку читабельности каждые 2 секунды. Так вы можете быстро довести текст до идеала.

Читабельность — это параметр, который обозначает объем усилий, которые должен затратить читатель, чтобы понять текст. Чем лучше этот показатель, тем легче понимать материал. В основном удобочитаемость определяется сложностью лексических и синтаксических приемов в тексте. Также на удобство чтения влияют такие типографические аспекты, как шрифт, его размер, интервалы и длина строки.

Большинство формул, предназначенных для расчета индекса удобочитаемости, используют несколько основных правил:

  1. Короткие предложения обычно легче понять, чем длинные.
  2. Простые и короткие слова намного легче понять, чем длинные и труднопроизносимые.
  3. Общеизвестные слова легче понять, чем узкоспециализированные термины или устаревшие слова.

Любой текст, который имеет хорошую оценку читабельности, намного легче читать а, следовательно, и понимать его. Если человек хочет продемонстрировать свой большой словарный запас и использует малоизвестные термины и сложные выражения, то это отрицательно влияет на индекс удобочитаемости, поскольку некоторые люди могут не знать о них. Если текст трудно понять, многие люди просто перестанут его читать, и ваши мысли, какими бы они не были блестящими, останутся неизвестными.

Другим примером является сложный язык в контрактах, где люди не могут понять, что они подписывают. В результате, чтобы не оказаться в неудобной ситуации, люди обычно читают контракт несколько раз, чтобы понять его полностью. Конечно, это не тот случай, когда речь заходит о содержимом веб-страницы. Как и в первом примере, люди просто закрывают вкладку со своей веб-страницей, если они не понимают, о чем текст. Чтобы избежать таких ситуаций, лучше улучшить текст и сделать его более удобным для чтения, используя более простые слова и синтаксические конструкции.

Читать еще:  Флешка 5 гб

Поисковые системы не используют индекс читабельности, как один из факторов ранжирования. В основном они обращают внимание на другие аспекты, такие как плотность ключевых слов и уникальность текста. Возникает логичный вопрос — зачем улучшать контент по этому параметру?

Важно помнить, что алгоритм ранжирования поисковых систем оценивает поведение пользователей на странице и сайте. Например, такие поведенческие факторы, как время, проведенное на странице и показатель отказов.

Следовательно, если текст удобен для чтения, пользователи будут чаще дочитывать его до конца и оставаться на вашей странице дольше. В результате он будет оцениваться лучше, так как поисковая система поймет, что ваш контент удовлетворяет запрос пользователя.

Удобочитаемость текста: как улучшить статью в два клика

Независимо от того, блоггер вы, маркетолог или онлайн-редактор, текст, написанный вами, должен соответствовать определенным правилам. Помимо орфографии, пунктуации и стилистической выверенности вы должны позаботиться и о том, чтобы его было удобно читать. Удобочитаемость текста, как бы странно это ни звучала, является одним из «неофициальных» факторов ранжирования в поисковых системах. Чем более понятный текст, тем больше вероятность, что пользователь дочитает его. Отсюда растет время пребывания на странице, снижается показатель отказов.

Критерии удобочитаемости текста

Для формального определения удобочитаемости текста разработаны различные математические формулы. С их помощью на основании двух главных показателей — длина слов и длина предложения, рассчитывается индекс удобочитаемости текста (ИУТ). Он не заменяет суждения человека, но дает представление о том, соответствует ли текст формальным критериям хорошей читаемости.

В настоящее время ИУТ обсуждается чаще всего в области SEO. Существует несколько индексов, с которыми чаще всего работают SEO-копирайтеры. Самый популярны из них — индекс Флеша, который возрастом своим старше Интернета. Он был разработан автором Рудольфом Флешем в далеких 1940-50-х годах. Еще одной моделью для оценки понятности текста является Гамбургская концепция понятности. Исследовательская группа в Гамбурге разработала ее в 1960-70-х годах для упрощения канцелярского стиля. Цель этого упрощения заключалась в том, чтобы воспроизвести информацию таким образом, чтобы все группы населения могли понимать ее одинаково.

Есть много других способов измерить ИУТ. Индивидуальные методы измерения создают разные критерии, разрабатываются для разных языков, а иногда имеют особые целевые группы или текстовые формы. И когда дело доходит до маркетинговых или продающих текстов, критерии объективности должны быть взвешены тщательнее, чем в любом другом случае.

Три процедуры оценки удобочитаемости

Теперь на практике разберем три показателя удобочитаемости: индекс Флеша, Флеша — Кинкейда и туманности Ганнинга (фог-индекс). Мировая практика показывает, что эти три индекса наиболее универсальны и хорошо зарекомендовали себя во многих областях.

Индекс Флеша

Является классическим среди формул удобочитаемости. При его расчете учитываются две ключевые цифры: средняя длина предложения (СДП) и среднее число слогов в слове (СЧС).

Изначально тест был разработан для английского языка, поэтому формулы для разных языков несколько отличаются друг от друга.

Чем выше показатель удобочитаемости, тем легче читателю понимать текста. Значения в таблице распределяются согласно степени усваиваемости текста: чем выше индекс, тем проще текст к пониманию.

Индекс Флеша был рассчитан для всех семи книг о Гарри Поттере, и средний балл по ним получился 72,83. Самой простой была книга «Гарри Поттер и Философский камень» — 81.32.

Индекс Флеша-Кинкейда

Это еще один показатель удобочитаемости текста. Уже само его название указывает на связь с индексом Флеша: оба были разработаны в 1970-х годах для ВМС США. Данный тест также основывается на критериях СДП и СЧС, но длина предложения взвешивается сильнее, чем в индексе Флеша.

Индекс Флеша — Кинкейда используется в пакете Microsoft Office для проверки на удобочитаемость.

Индекс туманности Ганнинга (фог-индекс)

Этот тест также был разработан для английского языка — классификация основана на оценках средней школы в США. Он был разработан в 1952 году бизнесменом Робертом Ганнингом и особенно популярен в секторе управления, часто используется для оценки годовых отчетов.

Индекс туманности оценивает различные показатели по ранее описанным метрикам анализа:

  • Количество слов в тексте (С);
  • Количество предложений в тексте (П);
  • Количество «сложных слов» с тремя или более слогами (СС).

Показатель читаемости рассчитывается на основе этих цифр.

Современные CMS чаще всего самостоятельно или через плагины просчитывают индекс читаемости. Если ваша CMS не обладает подобным функционалом, вы можете сделать это сами, протестировав текстовый фрагмент всего на 100 слов из своей статьи.

Индекс читаемости и SEO

Большинство текстов в Интернете предназначены для предоставления четкой информации. Поэтому тексты с высокой степенью удобочитаемости более понятны и востребованы как пользователями, так и поисковыми алгоритмами. Опыт экспертов SEO показывает, что тексты с читабельностью от 30 до 60 (индекс Флеша) воспринимаются лучше. Поэтому рекомендуется проверять текстовое содержимое страницы с помощью использовать индекса удобочитаемости.

Читать еще:  Не отображается привод dvd
Как улучшить индекс читаемости

Если проверка текста показала слишком низкую степень удобочитаемости текста, вы можете исправить его. Ниже мы привели список тех элементов, которых необходимо избегать для хороших значений ИУТ.

  • Ненужные технические термины;
  • Иностранные слова;
  • Аббревиатура;
  • Длинные предложения (более 13-15 слов);
  • Длинные слова;
  • Длинные абзацы;
  • Большое количество вводных слов;
  • Пассивные конструкции и модальные глаголы (например,могли, могли бы, должны были бы).

Если вы возьмете на заметку эти рекомендации, ваш текст будет выгодно отличаться от текстов конкурентов. Вы сможете донести до посетителя всю необходимую информацию быстро и четко, а сама статья будет понятной и красивой. Такой подход гарантирует симпатии и со стороны читателей, и со стороны поисковых алгоритмов. Как говорится, и волки сыты, и овцы целы.

Автоматический индекс читаемости: как он стал важным инструментом технических писателей

В 1960-е были пересмотрены разные формулы читаемости, благодаря чему появилась новая — подходящая для пишущих машинок. Тот период значительно повлиял на то, как мы измеряем читаемость сегодня. Но откуда всё пошло и как удачнее это использовать?

Что такое автоматический индекс читаемости?

В некотором смысле автоматический индекс читаемости (англ. Automated Readability Index — ARI) похож на другие формулы. Он измеряет читаемость отрывка текста и сопоставляет её с годом обучения в американской системе образования.

Правда, в отличие от других, он считает не количество слогов в слове, а количество знаков. Чем больше знаков, тем труднее читать.

Учитывается также и количество предложений. Иные формулы, в основе которых лежит другой подход, измеряют лишь списки слов и слоги.

Как появились тесты?

ARI разрабатывался для военных в 1967 году, чтобы оперативно отслеживать читаемость на электронных пишущих машинках.

Именно благодаря этому процесс стал гораздо легче вычислений вручную.

Результаты получаются те же, что и при использовании других методов. Это подчёркивает надёжность наиболее популярных из них.

Для наилучшего понимания текста он должен быть написан под ту аудиторию, что будет его читать.

Учебно-техническое командование ВМС

Как тесты работают?

ARI рассчитывается по следующей формуле:

Раньше для упорядочивания использовали дополнительное приспособление — табулятор индекса читаемости, который прикрепляли к пишущей машинке.

Он подставлял в таблицу количество строк, слов и предложений в каждом из абзацев.

Этот удивительный прибор позволял вычислять читаемость по ходу набора текста, что освобождало от необходимости производить расчёты вручную — задача объёмная и не всегда с точным результатом.

Это стало важным шагом в автоматизации анализа читаемости. В компьютерный век появилась возможность сочетать сразу несколько алгоритмов.

Когда стоит применять ARI?

В 1970-е годы было в проведено исследование при участии 531 солдата и сержанта ВМС, в котором проверяли их понимание текстов.

Исследование называлось «Выведение новых формул читаемости для солдатов и сержантов ВМС (автоматический индекс читаемости, индекс туманности Ганнинга и индекс читаемости Флеша)».

Формулы отбирали на основе того, что в качестве одной из переменных выступало предложение — такие подсчёты считаются более точными для технических текстов.

Цель исследования — улучшить читаемость учебных материалов. Споры шли вокруг необходимости высчитывать показатели вручную.

По результатам учебные пособия оказались слишком сложными для испытуемых.

Глава учебно-технического командования отметил эти выводы и признал, что читаемость «уже много лет представляет проблему».

Исследование также выявило различие между формулами, учитывающими предложения. ARI оказался более надёжным, чем индекс читаемости Флеша именно из-за автоматизации процесса.

ARI стал более удачным решением из-за упрощённой формулы, подходящей для ВМС.

К счастью, сейчас можно автоматизировать любую формулу читаемости.

Ещё одно исследование пользы ARI проводили американские ВВС в конце 1960-х.

Задача исследования — подчеркнуть «дорогостоящие последствия ненадлежащей коммуникации». Для них было очевидно, что ясно написанные документы предотвратят ошибки при взаимодействии.

В ВВС сомневались, стоит ли при подсчете индекса читаемости для взрослых людей учитывать размер предложений.

Они также отмечали, что необходимо учитывать фоновые знания читателя в выбранной области. К примеру, обыватель предпочтёт упрощённую версию документа, а человек, пытающийся найти ответ на конкретный вопрос, справится и с более сложным текстом.

Они выбрали ARI, так как знаки в слове считать быстрее, чем слоги. Пожалуй, для технических документов скорость и производительность — это главное.

А какая мне польза от ARI?

Если говорить о каком-то выводе, то он такой: читаемость важна.

Исследования показали, насколько значима ясность текста. Работа над читаемостью — это не упрощение текста до нельзя, а уход от запутанного слога, чтобы сделать его доступным для большего числа читателей.

В таком случае, читаемость жизненно необходима с финансовой точки зрения. ARI помог выявить места в учебных пособиях, которые было необходимо переработать для лучшего понимания.

Это важно и для письма в целом, ведь у вас только 7 секунд, чтобы завладеть вниманием читателя.

Выбираете длинные слова, когда есть более простые синонимы? Может, предложения слишком длинные, чтобы вызвать реакцию?

Читать еще:  Устройство дисковода dvd

Базовые принципы копирайтинга уходят корнями в читаемость. Если обычный человек посчитает ваш текст слишком сложным, он не прочтёт его до конца.

А вы для обычных людей пишете?

P. S. В блоге есть подборка из 10 сервисов проверки читаемости текстов на анлийском и русском языках.

Перевела и подготовила Варвара Васильева, англо-русский переводчик-стажёр бюро переводов «Альянс ПРО»

Индекс читаемости флеша

Данная публикация посвящена алгоритму использования инструмента анализа текста в MadCap Flare. Пользователям же других продуктов для документирования будет полезно узнать о методах улучшения удобочитаемости технических текстов, которые можно применять при использовании любого программного обеспечения.

В MadCap Flare 2017 r3 появилась новая функция, которая позволяет оценить ваш проект Flare на удобство чтения, узнать среднюю длину предложения и другие параметры.

Чтобы запустить анализ текста, откройте файл с контентом (например, топик или сниппет). Выберите ленту Tools. В разделе Proofing выберите Text Analysis. Откроется панель с анализом текста.

Когда вы используете инструмент анализа текстов, вы можете запустить проверки, которые анализируют файлы с контентом по ряду параметров:

После щелчка по кнопке Analyze вы получаете результаты, которые показывают оценку удобства чтения, уровня качества и другие. Но что конкретно значат эти цифры?

Значение оценки

Баллы в своей основе имеют тесты «Индекс удобочитаемости Флеша» и «Индекса качества Флеша-Кинкейда». Тест лёгкости чтения Флеша генерирует баллы в диапазоне от 1 до 100, что грубо коррелирует с тем, насколько легко или тяжело читать текст. Чем выше количество баллов, тем проще читать контент. И чем ниже результат, тем читать труднее.

Чтобы понимать значение баллов теста лёгкости чтения Флеша, мы упростили эту задачу во Flare с помощью цветных полосок; зелёная полоска показывает, что результат хороший, жёлтый цвет показывает средний результат, а красный – низкий результат.

Тест «Индекса качества Флеша-Кинкейда» — другая метрика удобочитаемости, основанная на уровнях качества в образовательной системе США. Баллы показывают уровень читаемости; например, если ваш контент оценивается числом 6, это соответствует шестому уровню качества чтения.

Когда речь заходит о документах, которые необходимо выкладывать в публичный доступ, лучше всего ориентироваться на уровень качества чтения до 8 баллов. Короче говоря, вам необходимо достигать больших значений теста лёгкости чтения и низких значений уровня качества.

Старайтесь, чтобы значение уровня качества чтения вашего контента было 8 или ниже – такой контент хорошо воспримут 80% читателей

Для получения дополнительной информации о том, как рассчитывается количество баллов, обратитесь к этой статье (на английском языке).

Четыре совета по улучшению удобочитаемости

Запуск инструмента анализа текстов может привести вас к пониманию того, насколько легко или трудно читать ваш контент. Если ваш контент был оценён по высокому уровню читаемости или сложности, то вам пригодятся несколько эти способов для улучшения удобочитаемости:

1. Уменьшите среднюю длину предложения

При анализе контента инструмент анализа текстов показывает вам значение среднего количества слов в предложении. Обычно при этом ставят цель до 20 слов в предложении, но это правило варьируется в зависимости от типа контента.

Один из способов — фокусироваться на количестве информации, передающейся в предложении. Адекватная длина предложения — это когда читатель может запомнить, как предложение начинается и заканчивается. Используйте списки для того, чтобы разделить предложения, перегруженные информацией, или разделите их на более короткие предложения.

2. Минимизируйте плотность пунктуации в предложении

Результаты с высокой плотностью пунктуации на предложение могут означать, что предложения слишком длинные или витиеватые. Следующие факторы могут быть причиной чрезмерного использования пунктуации:

  • Соединение с помощью запятой: Разбейте предложения, в которых две независимых мысли разделены запятой.
  • Кавычки: Вместо использования кавычек для передачи смысла, рассмотрите возможность использования вместо этого курсива, использование жирного шрифта или подчёркивание слов.

Дополнительную информацию о проблемах с пунктуацией можно узнать из этой статьи.

3. Уменьшите размер абзацев

Длинные абзацы с несколькими разрывами могут быстро утомить читателя. Это особенно важно для онлайн-контента, где продолжительность концентрации внимания короткая, и пользователи быстро ищут ответ. Поставьте себе цель заканчивать абзац после пары предложений.

4. Следите за уникальными словами

Ещё одна цифра в инструменте анализа текстов показывает общее количество уникальных слов, использующихся в контенте. Если количество уникальных слов кажется небольшим в сравнении с количеством слов, это может говорить о том, что в контенте встречаются повторяющиеся слова.

Посмотрите, нет ли предложений, начинающихся с одного и того же слова, например, «я» или «мы». Или, может быть, есть конкретное слово, которое повторяется по всему тексту. В общем, эта метрика позволяет вам узнать, когда имеет смысл добавить большее разнообразие в ваш текст.

Заключение

Существует множество факторов, которые увеличивают качество рукописи, включая структуру, оформление и другие. Для пользователей, которые ищут, с чего начать, новая функция Flare предоставляет шанс понять общую удобочитаемость контента.

Ссылка на основную публикацию
ВсеИнструменты 220 Вольт
Adblock
detector