Не обращая на них является "хороший механизм фильтрации" выберите состоятельных студентов. @TomKelly "неосуществимо"? Если вы ссылаетесь на них, вы читали их, верно? Так что вы можете бегло-читайте имена авторов для диакритических знаков, и если таковые имеются, проверить их экспортируемого ОК. Читая документы должны быть гораздо более трудоемким, чем сканировать обложки для диакритических знаков, и экспорт и вставка привожу более трудоемкий, чем проверка текста на ожидаемый диакритические знаки. Так как эта проблема, если вы ссылаетесь на документы, вы на самом деле не видел? Кроме того, это нормально в вашем поле запретить "и соавт." даже для бумаг с более чем пяти авторов?

Вы можете отрицать ваше регулярное выражение, чтобы найти первый неверный Чаре

Ваше текущее регулярное выражение

ул. $ ="в файле скрипте я проверяю, если данная строка имеет недопустимые знаки или нет".
$ для regex='^[]0-9а-Яа-я,!^`@{}=().;/~_|[-]+$'
$ [[ $стр =~ $выражение ]] && Echo с пропуском || эхо не
не

Не на пространствах. Отменяет регулярное выражение: удалить строку якоря и трейлинг + квантификатор; отменяет скобочное выражение -- мы имеем набор не допустимые символы:

для regex='[^]0-9а-Яа-я,!^`@{}=().;/~_|[-]'

Тогда

$ [[ $стр =~ $выражение ]] && Echo "а не: нашли '${BASH_REMATCH[0]}'"
плохо: нашли ' '