看了一篇关于保护版权的文章,//www.greatytc.com/p/bbf1386177c9
大家感触很深,探索了一下关于抄袭的问题。
北美之北:
必须得让维权的人有利可图,盗过我文章的最大的号是中国出版对外贸易总公司
雙木居士(古樹)博古林:
这个好!太多这样情况了!这个问题简书要重视和那些作者也是!
费漠尘:
让人羡慕的版权保护,今天还看到六神磊磊维权的文章,说周冲洗稿的事情这俩大神掐架了
KAFKA:
最流氓的是百家号,不洗稿 ,直接搬运。
Fuer:
什麼叫洗稿?不是剽竊科研成果其實無所謂。一般會被抄的文章,只能說明很通俗,其實也沒什麽了不起啊。
北美之北:
洗稿也是剽窃,只是花点劳动,改头换面一下,不是完全照搬,我也不懂,没遇到过,只是老听人说这事
我:
这不好判断啊,比如抄故事,你讲一个故事,人家也讲一个,内容是一样的,但表达方式,有点不同。
或者,他用他自己的话,重新讲一遍,就像你记录了你的老师的讲课一样,这个版权难道属于你老师?
你老师的话从哪来的,这肯定也不是他独创的,对于大多数老师来说,他也只是个传授知识的,所以这些知识,即使是说是你老师的嘴说出来的,他也不敢说就是他的,所以,版权也是很难判别的。
除非大量的段落一模一样,比如达到一本书的30%(或更多,连标点符号都一样的,错别字也一样)以上,全是人家的,就可以判断为抄袭了。
KAFKA:
写文章都是有行文逻辑的,俩人讲的道理和争辩的角度可以一样,但是行文逻辑一样的概率就很小了。 其实事例当然可以借鉴,但很明显的把别人的骨架(行文逻辑)打散,然后移花接木成另外一篇,就不对了。
恩,所以还是意识问题。 最起码,写字的人要有一种基本的价值观的。
我小学到初中,语文老师都在班里说过同样的一句话:“天下文章一大抄,掐头去尾就是你的了”。 然后这句话在同学们抄作文的时候,常常用来安慰自己的内心。 渐渐地,就麻木了。
我:
是不对,问题是,从法律上来说这不算抄袭,只能说是参考,但从道德上来说,应该谴责。但,现代社会,人们的道德观,也比较淡漠了,学生时代,哪个学生没抄过,老师抄,教授还抄,这就是我们的学术也有这个问题,而且很多成名的人物也抄。
环境的影响啊,国外,日本,你学者教授敢抄,搞不好要坐牢的,比如日本韩国发现有抄的痕迹,有些人都自杀了,无脸活在这个世界上了。
还是一个大环境问题,教授有抄袭直接坐牢,名誉扫地,看谁敢抄,严格执行的问题。所谓的洗稿,我早就知道,就是替换单词的做法。
比如一篇文章,你有很多成语,我通过程序找到这些词汇,替换成别的,比如你很高兴,叫兴高采烈,我用程序给你改为内心狂喜,等等这类吧。
这样,意思基本上变化不大,但语言不一样了。
这样,他的一篇文章,不断的替换,然后,就形成了一批新的文章了。
Fuer:
文學的感悟有多少是自己的,其實很難區辨,絕大多數人要麽抄書本要麽抄別的一些寫作者,但少有人能把文章寫得比書本還讓人期待。至少我見過的極少。這已是笨辦法了。
Mr. Tips:
从数据上来说,一个大型语料库哪怕有上亿次,连续七个单词相同的情况,几率几乎为零。
所以在学术界连续三个单词相同的话,都会被标注出来。
如果两个人的文章进行语料库分析,如果有大量的五个字以上的重复的话,基本上都抄袭了。原创而出现多字组合重复的几率是非常非常小的。
我:
高级的就是,我说的方法,我看你的内容,我自己重新表达一遍,这已经不叫抄袭了。
这只能说是参考,或者再思考了。一般人有这个能力,人家自己去写了,还无聊的抄什么呢。
Toot.:
各种大神的文章不会被洗稿的洗稿的人能不能看得懂你们写的都是个问题
KAFKA:
对啊,有六十亿人,但却没有人的想法和你恰好是一样的。 最后看的还是写文章时候的行文逻辑,每个人搭建骨架的方法都是不一样的。
Mr. Tips:
参考别人的文章造诣是重新写而不出现大量重复的字符串的话,难度是非常高的,一般人是做不到的。
Fuer:
哈哈,那就是重新創作了
我:
这个很难说了,教授就可以做得到。更高级一点的是,翻译,把翻译搞成自己的了。
当然,高层次的人,才能认出来,也算是抄。比如,西方哲学家的一些偏门的书,有些人翻译一遍,就成他的了。这其实,也算是抄。当然了,这个一般人看不出来,甚至是所有人看不出来,就看当事人自己怎么想了。
Fuer:
要能翻譯得更好,就幹脆自己寫了。。
Mr. Tips:
你随便找一个中文大型语料库,你搜索一下n元字符串的频率,你看到多少个字以上它出现的频率到底有多低,你就知道原创还出现重复字符串的几率有多小。
判断抄袭的技术上根本不是问题,只是有没有这个意愿去做。
我:
你这是技术手段,真要用于实践,还得有法律立法问题。对,技术上完全可以做到,初级抄袭。我后面说的那个高级抄袭的作法,是做不到的。那个属于再加工了。
Fuer:
有這功夫,不如多讀幾本書。
KAFKA:
其实,即使是所谓的高级借鉴,也可以在书或者文章的后面写上:“本文的部分结论借鉴自《`````````》,感谢```````”。 所以,抛开技术不谈,到最后落归的还是道德感。
我:
这有利益,没有利益,谁搞?比如,中国某些极个别的学者,就是高级的抄法,不然怎么能当上教授呢。
Fuer:
不過抄者與被抄者之間至少有個共性:品味相近。
我:
有点英语水平的,就可以翻译,借助工具。比如google,然后,他再加工,当然这也算种写作方法,如果你不把它当成抄袭的话。简单再加工吧。
Mr. Tips:
我们在讨论同一个语言内。把别人的话重新说一遍而不出现重复,而且整篇文章都能够做到这是件非常困难的事情。学术写作最重要的训练就是改写。这些抄袭都是数据可以检测的,你搞个语料库,自己测试一下。你直接n元字符串的出现概率,一个大型语料库就可以看出来出现重复的几率有多小?所以判定抄袭不是技术问题,是法律和认知的问题
算了,咱不讨论了,我们没有在一个维度上讨论问题。
Fuer:
你说的那种高级抄袭,我们就假设它存在,它的难度比原创还高,抄袭的人就是不想原创,要省时省力,有那功夫人谁还去抄袭啊!
我:
好,同一个语言内,用自己的想法,把别人的话重新说一遍,这算不是抄袭。
我们来谈论一下这个高级的问题。
一个有很强表达力的人,假如看到了别人写的小说,故事情节很好,比如台湾的女作家三毛的,然后,大陆某一个青年人,把它用自己的话重新描述,改几个名字,再然后扩展一下,顺序什么都调整一下,于是搞成了流行书,比如那个郭XX,赚了大钱。
据说他有自己的工作室,专门改别人的故事,整合在自己的书里,你法律拿他没办法。我们先谈论什么算是抄袭?把这个问题,先从逻辑止搞清楚,然后再讨论,如何判别它。
通过技术,能不能判别?那直接让专家阅读呢?
KAFKA:
还是把写文章简单化了,我们都知道,写软文容易,但写一篇有内容、承载价值、逻辑性强的文章就难了。 如果在文章的风骨、角度、承载价值和逻辑上都是一样的,即使你的内容大部分不同,也是可以构成抄袭了吧。 因为,你不可能和另一个人的思想高度相似,甚至一模一样。
我:
这个有道理,但人家抄袭,肯定还是抄袭流行文稿嘛,有利益嘛。抄思想的人很少,因为他得不到什么利益。
我想表达的就三个观点,什么是抄袭,如何判断它是抄袭,抄袭的严重度如何计算处罚?
这个法律上当然有规定,但它规定的太笼统了,以至,人人以为是抄袭的内容,抄袭者自己不认为是抄袭,他自辨的空间也是非常大,很难判定他的罪行,现在,最多是公开给你道个歉,还不是说抄袭,而是有些地方参考了,没有注明清楚。
KAFKA:
技术虽好,但是没有价值观和思想,所以在有些领域其实还是只能起辅助作用。 不过我同意用技术做第一道防护网,比如百度,不是整天喊All In AI吗,那你就把AI用到百家号上,全网检测有没有抄袭。
恩,其实不只写作,大多领域都是这样的,维权在我们国家是个小众词语。
我们站在批判抄袭者的角度,都不能讨论出个所以然以及如何判断他们是否抄袭的结论来。更何况他们在抄袭、洗稿、借鉴的时候了,也许在那时他们只是认为自己是在独立写作,充其量是在借鉴一些早已公开的素材而已。
或许,我们每个人都犯过这种错误。
我:
像小说,琼瑶的,国内有年轻的作家就是抄袭了嘛,但,他不承认,最后官司判他抄袭,最后也只是不了了之。这个还要作家本人出来维权。这么大名气的作家,都不能全胜,更何况普通作者,要真维权,时间精力成本极大,在目前的中国。
抄袭者自己的良心,哪里去了?算了,不说了,刚好,大家的讨论,我要形成一篇文章了,希望这个不要认为我是偷懒写作。