import re a = "戴桂华女(力木通信)(航太通信)(博翼通信工程)\n刘满珍(农机厂)\n向吉斌,男(物贸)\n邓会(烟厂)\n何万远,男((电力公司)\n黄文玉,女((巨凝建材公司)\n何宗玲,女((客运公司)\n何菊林()妇幼\n王勇,男,广电(62.11.20)\n周娟,女,国资(63.10.13)\n" regex="^[\u4e00-\u9fa5]+?(?=女|,|()" it = re.finditer(regex,a,re.M) for match in it: print(match.group())